Tutorial 07: Contraste de Hipótesis. - PostData-Statistics · Tutorial 07: Contraste de ......

PostData Curso de Introduccin a la Estadstica

Tutorial 07:Contraste de Hiptesis.

Atencin:

Este documento pdf lleva adjuntos algunos de los ficheros de datos necesarios. Y est pensadopara trabajar con l directamente en tu ordenador. Al usarlo en la pantalla, si es necesario,puedes aumentar alguna de las figuras para ver los detalles. Antes de imprimirlo, piensa sies necesario. Los rboles y nosotros te lo agradeceremos.

Fecha: 9 de diciembre de 2017. Si este fichero tiene ms de un ao, puede resultar obsoleto.Busca si existe una versin ms reciente.

ndice

1. Contraste de hiptesis para la media en una poblacin normal. 1

2. Otros tipos de contrastes de hiptesis. 5

3. Ejercicios adicionales y soluciones. 20

1. Contraste de hiptesis para la media en una poblacinnormal.

Vamos a empezar este tutorial aprendiendo a utilizar R (y, en menor medida, otros programas)para llevar a cabo contrastes de hiptesis sobre la media de una poblacin normal. Aprenderemos,entre otras cosas, a calcular el p-valor del contraste y a establecer los lmites de la regin de rechazode la hiptesis nula H0.

1.1. Contrastes para en pob. normales con muestras grandes, paso apaso, usando R.

Empecemos suponiendo que el tamao de la muestra es suficientemente grande, de manera quepodemos usar la distribucin normal para analizar la distribucin de la media muestral X. Laterminologa y notacin que usaremos est en la Seccin 7.2 del libro. Recordemos que el esquemadel contraste, en este tipo de situaciones, es este:

1. Fijamos 0, y establecemos la hiptesis nula y la alternativa. La forma de las hiptesisdepende de que estemos en un contraste bilateral o unilateral; y en este segundo caso, dependede cul sea el lado.

2. Con los datos de la muestra, calculamos el estadstico adecuado. Este es el paso clave.Puede ser til consultar las tablas del Apndice B del curso en este paso.

3. Usando pnorm calculamos el p-valor, y usando qnorm calculamos los lmites de la regin derechazo (aqu interviene el nivel de significacin del contraste).

Ms adelante, en este mismo tutorial, vamos a escribir uno de esos ficheros plantilla de comandos Rque nos permiten automatizar la resolucin de los ejercicios bsicos, tpicos de los libros de texto.La parte no mecnica de este tipo de ejercicios, la que no podemos programar en R, es aquella enla que analizamos el enunciado del problema y decidimos el tipo de contraste que vamos a hacer:

1
http://www.postdata-statistics.com/

cul es la hiptesis nula adecuada, etc. Casi todo lo dems es programable. Las decisiones que hayque tomar durante el proceso que hemos esbozado se pueden implementar a travs de estructurascondicionales de tipo if-else, como las que hemos visto en la Seccin 3 del Tutorial04.

Vamos a utilizar R para ir recorriendo con el lector los clculos necesarios para el Ejemplo 7.2.1del libro, pg. 252, (y su continuacin en sucesivos ejemplos). Recordemos que el punto de partidade ese ejemplo es un contraste de hiptesis en el que la hiptesis nula H0 es de la forma:

H0 : { 0},

siendo 0 = 2.5. Para llevar a cabo ese contraste se ha tomado una muestra con

n = 100, X = 2.65, s = 0.5

En R, introducimos estos datos as:

mu0 = 2.5n = 100Xbar = 2.65s = 0.5

Como ves, usamos Xbar para representar la media muestral X, porque ese smbolo recuerda ala pronunciacin, en ingls, del correspondiente smbolo matemtico (podras usar Xbarra enespaol, si lo prefieres), y eso hace que muchos usuarios de programas estadsticos lo elijan comonombre para la media muestral.

El siguiente paso del contraste es el clculo del Estadstico adecuado. En el caso del contraste parala media de una poblacin normal, usando una muestra grande, ese estadstico es:

X 0sn

.

As que en R podemos hacer:

(Estadistico = (Xbar - mu0) / (s / sqrt(n)))

## [1] 3

El resultado es 3, como hemos visto en el libro.

Clculo del p-valor y la regin de rechazo.

Ahora vamos a calcular el p-valor del contraste. En este ejemplo, eso significa que tenemos quecalcular la probabilidad asociada a la cola derecha del estadstico (recuerda la Figura 7.1 del libro,pg. 255). Usando lo que ya hemos aprendido en otros tutoriales, el p-valor se obtiene en R mediantepnorm as:

(pValor = 1 - pnorm(Estadistico))

## [1] 0.0013499

Comprueba que este valor coincide con el que aparece en el libro.

A veces, en lugar del p-valor, fijamos un nivel de significacin ns (y el valor = 1 ns correspon-diente).

ns = 0.95(alfa = 1- ns)

## [1] 0.05

2

Y en ese caso, es frecuente que queramos calcular la regin de rechazo, que en este ejemplo es

R =

X 0sn

> z

,siendo z el valor tal que P (Z z) = . Usando pnorm, y teniendo de nuevo en cuenta que eneste ejemplo usamos la cola derecha, es un clculo muy sencillo:

(zAlfa = qnorm(1- alfa))

## [1] 1.6449

Para completar el recorrido que hemos hecho por el Ejemplo 7.1.1 y sus secuelas, te proponemosalgunos ejercicios.

Ejercicio 1.

1. Usa R para comprobar las cuentas de los Ejemplos 7.2.7 del libro (pg. 259) y 7.2.8 (pg.261).

2. A veces, en lugar de la regin de rechazo (definida por z), lo que queremos es saber cul esel valor X0 de X a partir del cual deberamos rechazar H0. Localiza ese valor en el Ejemplo7.2.1. Recuerda que, adems, debes decir si los valores que nos llevarn a rechazar H0 sonlos valores mayores que X0, o si por el contrario son los valores menores que X0. Es muyimportante que te hagas este tipo de preguntas en cada contraste, para evitar los errores mscomunes. Y una de los mejores maneras que conocemos es tratar de hacer una grfica sencillade lo que estamos calculando.

3. La variable X sigue una distribucin normal. Nuestra hiptesis (alternativa) es que su mediaes > 25. Para comprobar esa hiptesis hemos medido 200 valores de la variable X y hemosobtenido una media muestral igual a 26, con una cuasidesviacin tpica muestral igual a 7.Calcula el p-valor del correspondiente contraste de hiptesis. Calcula tambin la regin derechazo a un nivel de significacin del 95%. Rechazaras la hiptesis nula a ese nivel designificacin? Y al 99%?

Soluciones en la pgina 20.

1.2. Usando otros programas.

Est claro que el paso crucial en el contraste de hiptesis es el clculo del p-valor (o de la reginde rechazo). Y que en ese paso el ingrediente necesario es la resolucin de un problema directo (oinverso, respectivamente) de probabilidad para la distribucin Z. Por esa razn, podemos repetirlos resultados anteriores usando cualquier programa que nos permita resolver los problemas directose inversos de probabilidad para la distribucin Z. En particular, puedes usar Calc, o algunos delos programas que hemos visto en el Tutorial05, como GeoGebra y Wolfram Alpha.

Por ejemplo, para calcular el p-valor del Ejemplo 7.2.1 en Wolfram Alpha, puedes ejecutar elcomando:

P[Z > 3]

Ejercicio 2.

1. Comprueba que el resultado es el mismo que hemos obtenido antes.

2. Comprueba el resultado con algn programa que no requiera de conexin a Internet, comoCalc y/o GeoGebra.

3. Usa uno de esos programas para hacer el apartado 3 del Ejercicio 1.


3

Pero en el caso de GeoGebra disponemos de una herramienta mucho mas cmoda para calcularestos contrastes. Abre de nuevo la Calculadora de Probabilidades pero fjate en que en la partesuperior puedes elegir la pestaa llamada Estadsticas (hasta ahora hemos usado la que se llamaDistribucin). Esa pestaa te permite realizar, entre otras cosas, contrastes de hiptesis. El primeroque vers es esta ventana:

Inicialmente los campos de esta ventana estn vacos, claro. En esta figura vers el resultado quese obtiene cuando se sustituyen los datos del ejemplo inicial del Captulo 7 del libro, el Ejemplo7.2.1 (pg. 252). Hemos indicado adems, con flechas rojas, los lugares donde aparecen el p-valory el estadstico del contraste.

1.3. Potencia y tamao muestral.

Vamos a mostrar cmo se llevan a cabo, usando R, las cuentas de los Ejemplos 7.3.1 (pg. 262) y7.3.2 (pg. 265) del libro.

En el primero de esos ejemplos hemos visto que para calcular la potencia 1 del contrastenecesitamos calcular:

potencia = 1 = P

Z > z sn

.(ver Ecuacin 7.6, pg. 263 del libro), donde

= 0.05, = 0.1, s = 0.5, n = 100.

Para calcular la potencia en R basta por tanto con usar pnorm as:

alpha = 0.05delta = 0.1s = 0.5n = 100


4

## [1] 1.6449

(potencia = 1 - pnorm(zAlfa - delta / (s / sqrt(n)) ))

## [1] 0.63876

como aparece en el Ejemplo 7.3.1. Ten en cuenta que hemos usado 1 - pnorm porque estamoscalculando la probabilidad de una cola derecha (tambin puedes usar la opcin lower.tail =FALSE como hemos visto en el Tutorial05).

El clculo del tamao muestral en el Ejemplo 7.3.2 es muy sencillo (ver la Ecuacin 7.8, pg. 7.8del libro). Vamos a presentar los clculos completos a partir de los valores del ejemplo, para quete resulte ms fcil adaptarlo a otros posibles ejemplos:

potenciaDeseada = 0.80

delta = 0.1

s = 0.5

alfa = 0.01


## [1] 2.3263

(zPot = qnorm(1 - potenciaDeseada))

## [1] -0.84162

(tamannoMuestra = ( (s / delta) * (zAlfa - zPot))^2)

## [1] 250.9

Vamos a posponer parte del estudio de la potencia (y en particular el dibujo de las curvas depotencia), hasta que hayamos podido explorar otros tipos de contrastes de hiptesis, para aspoder dar un tratamiento ms general a este tipo de clculos. De momento, aqu tienes un ejerciciopara practicar.

Ejercicio 3.

1. Calcula la potencia del contraste que aparece en el apartado 3 del Ejercicio 1 (pg. 3), usando = 0.2 y = 0.95.

2. Calcula el tamao muestral necesario para alcanzar una potencia 0.80 usando el mismo valorde y .


2. Otros tipos de contrastes de hiptesis.

El ejemplo inicial del Captulo 7 del libro, el Ejemplo 7.2.1 de los canguros depresivos, contiene todoslos ingredientes bsicos de los contrastes de hiptesis. A medida que avancemos en la Estadsticaencontraremos muchas variaciones sobre ese tema. Y en esta seccin del tutorial vamos a ocuparnosde las primeras de ellas.

5

2.1. Los restantes tipos posibles de hiptesis nulas.

En la Seccin 7.4 (pg. 267) del libro hemos visto cmo proceder en el caso de un contrasteunilateral en el que la hiptesis nula sea de la forma

H0 = { 0}

y tambin en el caso de un contraste bilateral en el que la hiptesis nula sea de la forma

H0 = { = 0}.

En realidad las cuentas que debemos hacer en estos dos casos son muy parecidas a las que hemosvisto en los ejemplos previos. Vamos a ver sendos ejemplos de cada uno de los tipos de contraste,para que puedas comprobar las similitudes y diferencias entre ellos. Te recomendamos que tengaspresentes las figuras que aparecen en la Seccin 7.4 mientras lees los siguientes Ejemplos.

2.1.1. Contraste unilateral con H0 = { 0}.

Para empezar, vamos a usar este ejemplo, que es un tpico ejercicio de libro de texto:

La inspeccin de consumo est examinando un envo de latas de conserva, de las que el fabrican-te afirma que el peso medio son 1000 gramos. Al examinar una muestra aleatoria de 100 latas,un inspector obtuvo un peso medio muestral de 998.5 gramos, con una cuasivarianza muestral des2 = 36.1 (gramos2). Con esos datos, el inspector se pregunta si el peso medio de las latas ser enrealidad menor que el enunciado por el fabricante. Al nivel de confianza 95%, qu responderas ala pregunta del inspector? Queremos, adems, obtener el p-valor de este contraste.

En este caso la hiptesis alternativa del inspector es:

Ha = { < 0},

siendo el peso medio real (y desconocido) de las latas, mientras que 0 = 1000 gr. es el pesopublicitado por el fabricante. Puesto que el tamao n = 100 de la muestra es grande, sabemos queesta cantidad (el estadstico)

X 0sn

se distribuye segn la normal Z N(0, 1). Para calcular el valor de este estadstico usamos uncdigo muy parecido al del anterior contraste:

mu0 = 1000n = 100Xbar = 998.5(s = sqrt(36.1))

## [1] 6.0083


## [1] -2.4965

Es de esperar que el valor del estadstico sea negativo. Si fuera positivo, querra decir que la mediamuestral X es mayor que 0. Es decir que el peso medio de las latas de la muestra es mayor de loque afirma el fabricante. Y en tal caso, el inspector no tendra ninguna razn para sospechar de loque dice el fabricante.

Ejercicio 4.

1. Calcula el valor del estadstico si la media muestral del peso fuera bastante menor de lo quedice el fabricante, por ejemplo X = 990 gramos.

2. Calcula ese valor del estadstico si la media muestral del peso fuera prcticamente igual a loque dice el fabricante, con X = 999.99 gramos.

6

3. Y cul sera el valor del estadstico si fuera X = 1005 gramos?

4. Haz un dibujo aproximado de la normal estndar Z (no hace falta que sea muy preciso) ysita en ese dibujo los valores del estadstico que has calculado en los apartados anteriores.Despus responde a estas preguntas: en ese dibujo, dnde estn los valores que nos hacenpensar que Ha puede ser cierta? Y dnde estn los valores que nos hacen pensar que H0puede ser cierta?

5. Te atreves a calcular el p-valor del contraste? Vamos a ver la respuesta enseguida, pero esbueno que intentes adelantarte para comprobar si ests entendiendo las ideas bsicas.


No sigas, si no has hecho este ejercicio!

7

Clculo del p-valor y la regin de rechazo en este caso.

A la vista de los resultados de este ejercicio y de la discusin de la Seccin 7.4 del libro (pg.267), debera estar claro que para calcular el p-valor de este contraste tenemos que usar la colaizquierda de la distribucin normal, porque esa cola la forman los valores favorables a la hiptesisalternativa. En R, el clculo sera:

(pValor = pnorm(Estadistico))

## [1] 0.0062707

Recuerda que el p-valor indica cmo de improbable le parecen estos datos muestrales a alguienque cree que la hiptesis nula es cierta. En este caso, a alguien que cree que el peso medio de laslatas es de 1000 gramos o ms. El resultado que hemos obtenido significa que, si lo que dice elfabricante es cierto, la probabilidad de obtener al azar un lote de 100 latas con un peso medioX = 998.5 es aproximadamente igual a 0.00627. Parece bastante evidente que el inspector tendrabuenas razones para poner bajo sospecha esa afirmacin del fabricante.

Naturalmente, el fabricante puede insistir en que ha tenido mala suerte y que los resultados quehemos obtenido pueden ser fruto del azar... Para evitar una discusin improductiva, usamos losniveles de verosimilitud como una forma de zanjar este asunto. Podemos establecer, en los regla-mentos de consumo, que los inspectores utilizarn un nivel de significacin del contraste 99%. Esdecir ns = 0.99, con lo que = 0.01. Y puesto que el p-valor 0.00627 es menor que , el inspectorpuede rechazar la hiptesis nula y sancionar al fabricante por faltar a la verdad sobre el peso deesas latas.

Como ves en este ejemplo, el nivel de significacin puede utilizarse para fijar un criterio objetivo,establecido a priori (antes de empezar las inspecciones), que ayuda a todas las partes implicadasal definir las reglas del juego.

Cul es la regin de rechazo en este ejemplo, al nivel de confianza del 99%? Para calcularla esbueno hacerse la pregunta de esta otra manera. Cul es el valor del estadstico para el que elp-valor coincide precisamente con ? Y el clculo, en R, sera:

nc = 0.99(alfa = 1 - nc)

## [1] 0.01

qnorm(alfa)

## [1] -2.3263

Ese valor del estadstico marca la frontera entre los valores que nos llevan a rechazar la hiptesisnula y los valores que no nos hacen rechazarla (recuerda que nunca la aceptamos). Cualquier valordel estadstico menor que 2.326 nos llevara a rechazar H0 Por qu menor? Si no ves claro porqu, vuelve a leer este ejemplo y la Seccin 7.4 del libro hasta que lo entiendas.

Ejercicio 5. El valor 2.326 que hemos obtenido es un valor tipificado, en la escala Z de la normalestndar. Cul es el valor correspondiente en la escala original del problema? Es decir, cul espeso medio mnimo muestral, en gramos, a partir del cual el inspector rechaza H0? Solucin en lapgina 25.

2.1.2. Contraste bilateral con H0 = { = 0}.

Vamos a volver a usar el ejemplo de las latas de conservas. Pero ahora vamos a pensar en estemismo problema desde otro punto de vista, desde la perspectiva del fabricante. Es importanteentender la diferencia entre su punto de vista y el punto de vista del inspector. Al inspector elnico problema que le preocupa es que el peso de las latas pueda ser menor de lo que anuncia elfabricante, porque eso podra suponer un fraude a los consumidores. Si el fabricante decide envasaren cada lata ms producto del que anuncia, el inspector no tendr nada que objetar. En cambio el

8

fabricante tiene que tomar una decisin ms complicada. Por un lado, si envasa demasiado pocoproducto, sabe que el inspector le sancionar. En cambio si, para evitar eso, envasa demasiadoproducto en cada lata, estar perdiendo dinero. Cul debe ser entonces su objetivo? Lo razonablees tratar de conseguir que la cantidad de producto envasado se parezca mucho al objetivo marcado0 = 1000 gramos. As que el fabricante tratar de controlar el proceso de envasado para ver si secumple la hiptesis nula (bilateral):

H0 = { = 0}.

El departamento de control de calidad de la fbrica trabajar para contrastar esta hiptesis frentea la hiptesis alternativa

Ha = { 6= 0}.

teniendo siempre presente que todas las desviaciones con respecto a 0 son malas: si est de-masiado por debajo de 0 nos sancionarn, y si est demasiado por encima de 0 estaremosperdiendo dinero.

La clave, en cualquier caso, es la palabra demasiado. Si los valores del peso envasado son suficien-temente parecidos a 0 estaremos alcanzando un equilibrio razonable entre ambos problemas.

Vayamos a los datos para ver cmo funciona esto en la prctica. Imagnate que el fabricante,despus de la sancin del inspector, ha diseado un nuevo proceso de envasado, y quiere saber siese proceso es satisfactorio. Ya sabemos que hay que trabajar a un nivel de confianza del 99 %para evitar la sancin del inspector. As que el fabricante examina una nueva partida de 100 latasfabricadas con el nuevo sistema de envasado y obtiene una media muestral de X = 999.7 gramos,con una cuasivarianza muestral de s2 = 20.2 gramos2.

Para contrastar la hiptesis nula H0 = { = 1000} el fabricante empieza por calcular el valor delestadstico:

mu0 = 1000n = 100Xbar = 999.7(s = sqrt(20.2))

## [1] 4.4944

(Estadistico = abs(Xbar - mu0) / (s / sqrt(n)))

## [1] 0.66749

Fjate en el valor absoluto! Hemos usado la funcin abs en el estadstico, porque al fabricantele preocupa quedarse corto de peso, pero tambin le preocupa pasarse.

Ejercicio 6.

1. Cul sera el valor del estadstico si el peso medio muestral fuera X = 1000.3?

2. Cul tiene que ser el peso medio muestral para que el estadstico valga 2? Hay ms de unarespuesta a esta pregunta?

3. En este ejemplo de las latas, las dos colas de la distribucin normal se pueden identificar,respectivamente, con uno de los problemas que preocupan al fabricante: la sancin de lainspeccin o el exceso de producto envasado. Qu cola corresponde a cada uno de esos dosproblemas?


Clculo del p-valor y la regin de rechazo en este caso.

El p-valor siempre representa (en cualquier contraste) la probabilidad de obtener un valor delestadstico al menos tan favorable a la hiptesis alternativa como el que hemos obtenido en lamuestra. En este caso eso significa que debemos tener en cuenta las dos colas de la distribucinnormal, porque ambas contienen valores favorables a Ha.

9

Como hemos visto en la Ecuacin 7.15 del libro (pg. 271) el p-valor se calcula as a partir delestadstico:

p-valor = 2 P

Z > |X 0|sn

= 2 P (Z > Estadstico) ,lo cual se traduce en este cdigo en R:

(pValor = 2 * (1 - pnorm(Estadistico)))

## [1] 0.50446

Este p-valor es muy grande (mayor que 1/2). Y por lo tanto, no rechazamos la hiptesis nula. Entrminos del ejemplo, este p-valor indica que el fabricante est cumpliendo su objetivo: el valor delpeso envasado est suficientemente cerca del objetivo de 0 = 1000 gramos.

Ejercicio 7.

1. Por qu hemos usado 1 - pnorm (en lugar de pnorm) en este clculo?

2. Ahora imagnate de nuevo que eres el inspector y utiliza los mismos datos que el fabricantepara contrastar la hiptesis nula unilateral H0 = { 1000} a un nivel de significacin del99 %. Qu p-valor has obtenido? Cul es la conclusin a la que llega el inspector?

3. Qu sucede con los p-valores del fabricante y el inspector si X = 999.1?

4. Puede suceder, para unos mismos valores muestrales, que el fabricante no rechace al 99%la hiptesis nula bilateral H0 = { = 1000}, pero que el inspector s rechace la hiptesis nulaunilateral H0 = { 1000}?

Solucin en la pgina 26.

La regin de rechazo, cuando usamos un nivel de significacin ns = 99 %, la forman los valores delestadstico que pertenecen a cualquiera de las dos colas de la distribucin Z definidas por el nivelde significacin (ver la Figura 7.5 del libro, pg. 269):

ns = 0.99(alfa = 1 - ns)

## [1] 0.01

(alfaMedios = alfa / 2)

## [1] 0.005

(zAlfaMedios = qnorm(1 - alfaMedios))

## [1] 2.5758

Como indican estos clculos z2 2.576. La regin de rechazo la forman los valores del estadstico

que son mayores que 2.576 o menores que 2.576. Una forma ms breve de decir esto es diciendoque son los valores del estadstico cuyo valor absoluto es mayor que 2.576.

2.1.3. Sobre contrastes unilaterales y bilaterales.

Opcional: esta seccin puede omitirse en una primera lectura.

Una lectura atenta de los ejemplos anteriores permite observar que, para un mismo valor de 0 ypara un nivel de significacin dado ns, el lmite de la regin de rechazo de la hiptesis nula delcontraste bilateral

H0 = { = 0}

10

se sita ms a la derecha que el lmite de la regin de rechazo de la hiptesis nula en un contrasteunilateral

H0 = { > 0}.En definitiva, lo que estamos diciendo se reduce a observar que

z < z2 ,

ya que esos dos valores definen el lmite de las regiones de rechazo. Eso significa que con un valordel estadstico mayor que z podemos rechazar H0 en el caso unilateral, mientras que ese mismovalor no permite rechazar H0 en el caso bilateral.

Esta observacin tiene una consecuencia que nos parece desafortunada. Ya hemos dicho que enmuchas ocasiones la hiptesis nula representa la teora vigente y que la hiptesis alternativa repre-senta una teora nueva que aspira a sustituir a la antigua. Pero en muchas aplicaciones cientficas(por ejemplo, y de forma especial, en Ciencias de la Salud) se aplica una forma especial del dichoms vale lo malo conocido que lo bueno por conocer. Ese principio de precaucin hace que, enel contraste de hiptesis, dejemos que la hiptesis nula juegue con ventaja. Y algunas personas,llevados por un exceso de prudencia, deciden utilizar la regin de rechazo del contraste de hiptesisbilateral incluso cuando la hiptesis nula es claramente unilateral. En la prctica, eso equivale atrabajar con /2 en lugar de y, por lo tanto, cuando esas personas nos dicen que han hechoun contraste de hiptesis al 95% (con = 0.05), en realidad han usado /2 = 0.25 y su nivelde significacin es ns = 0.975. El resultado es, finalmente, que hemos elevado el listn para elrechazo de H0. Pero sera mucho ms sencillo, y mucho ms claro, si eso es lo que se desea, elevarsimplemente el nivel de significacin en el contraste unilateral.

2.2. Datos en bruto.

En el Tutorial06 hemos establecido una distincin los que llambamos los problemas del mundoreal, en los que recibimos los datos de la muestra en bruto, y aquellos otros que llamamos problemasde libro de texto, en los que el punto de partida son los valores X, n, s, etc. Es importante recordarque esa distincin no es una definicin formal. Es simplemente una convencin y cada uno delos problemas que nos encontraremos, en los libros o en la vida real, contendr su propia mezclapeculiar de ambos ingredientes.

Con los contrastes, naturalmente, sucede otro tanto. Los clculos que hemos realizado hasta ahora,los del Ejemplo 7.2.1 del libro, son tpicos de los problemas de libro de texto. Si el punto de partidaes una muestra en bruto, tenemos dos opciones. La primera es calcular los valores necesarios (enprincipio, X, n, s) a partir de la muestra, ya sea a mano o usando un fichero plantilla (en estetutorial te facilitaremos algunos de esos ficheros). La segunda es usar una funcin como la funcint.test de R, con la que ya nos hemos encontrado en el Tutorial06. Vamos a dejar para un pocoms adelante en el tutorial esta segunda opcin, y desarrollaremos ahora la primera.

Para concretar vamos a trabajar con un fichero de datos que hemos cocinado para que imiten loque sucede en el Ejemplo 7.2.1. El fichero es este, que adjuntamos aqu:

Si el punto de partida es un fichero como ese, el plan de trabajo es muy parecido, salvo por elhecho de que primero debes leer los datos (usando scan o read.table, cada una tiene sus ventajase inconvenientes) y, una vez ledos, calcular a partir de esos datos los valores de n, X y s. Porejemplo con este cdigo:

datos = read.table(file = "../datos/Tut07-Contraste-Media-Z-datos.csv")[ ,1](n = length(datos))

## [1] 100

(Xbar = mean(datos))

## [1] 2.65

(s = sd(datos))

## [1] 0.5

11

2.320214678998022.731802555627772.640930376279653.210904751887361.985063555134372.732502847723342.706682912258882.768315601884712.795764904680873.580837925174673.086976120196592.599908333911132.762853972836072.515768221633662.248214416961793.009470902372552.505996681449183.436104717213842.648043750816712.891144035445412.632644250465443.083463811386313.24657190587532.439997973755812.619444200584643.736998062166243.54566594551712.736494194067742.001319237125933.203074335622852.952754600357362.687731117946332.815178702972731.911210305266572.513894389120932.662316523106992.981067329054562.815862996740532.452984779796982.075790908838182.087385294542573.037486391609032.544001256056782.445597556857872.237675387956042.682954481664371.751068421428922.597332282311772.542431933138662.182773207454112.796973191411472.738316202830642.181490555118093.13081402924222.492817795631312.96572207260622.948293351275542.604692829551362.632477281163142.640015976082922.710910658189572.171131481776651.929693225239462.656030161474472.686103650084843.758620295401362.129965384331772.163486973558993.292840534998241.991039383748321.805611003841062.648801092997552.618878715640221.704857394044912.652993950459313.807295864223272.64995653808993.294012168721972.887350408554132.727175445159361.506443386713893.066170181182232.241964587885911.517947369981892.254496539631272.956970511415532.828595557455362.993726185941762.471004969321021.07008611456592.248405741029172.908322035060993.021931922986153.076584155207552.946773306148062.105537024267742.830033738556673.609775881323453.149729560580632.37646057002145

Como ves, los valores coinciden, con la precisin necesaria, con los que aparecen en el Ejemplo7.2.1.

Es muy importante entender que el contraste de hiptesis, a partir de este punto, transcurreexactamente igual que antes. Calculamos el estadstico

X 0sn

con estos valores (y con 0, que procede de la hiptesis nula) y lo usamos para obtener el p-valoro la regin de rechazo. Para que quede claro, repetimos el clculo del p-valor usando exactamentelos mismos comandos que vimos en la pgina 2:

mu0 = 2.5


## [1] 3


## [1] 0.0013499

El resultado es (con toda la precisin que podamos necesitar) el mismo.

Para que puedas practicar esto, aqu tienes un ejercicio.

Ejercicio 8. El fichero

contiene una muestra con cierto nmero de observaciones de una variable X de tipo normal. Usaesa muestra para contrastar la hiptesis nula:

H0 = { 27}.

Solucin en la pgina 27.

Opcional: Cmo se han cocinado los datos de esta seccin?

En aras de la transparencia, y por si sientes curiosidad, vamos a incluir aqu la receta que hemosusado para cocinar los datos del fichero Tut07-Contraste-Media-Z-datos.csv (recuerda que hayque fijar el directorio de trabajo antes de ejecutarlo, para que el fichero csv termine almacenado enla carpeta datos). El fichero csv que vamos a cocinar contiene, usando el lenguaje del Ejemplo 7.2.1,las medidas de la altura de los saltos de 100 canguros depresivos tratados con Pildorn Complex.Como puedes ver en los resultados del cdigo, la media muestral es X 2.65 y la cuasidesviacintpica muestral es s = 0.5. Hemos usado por comodidad write.table para escribir esos datos enel fichero csv, eliminando los nombres de filas y columnas.

library(MASS)set.seed(2014)muestra = c(mvrnorm(100, mu = 2.65, Sigma = 0.5^2, empirical = TRUE))

mean(muestra)

## [1] 2.65

sd(muestra)

## [1] 0.5

write.table(muestra, file = "../datos/Tut07-Contraste-Media-Z-datos.csv",row.names = FALSE, col.names=FALSE )

12

26.579631385415127.278094420443327.123884683492728.091128994805126.010881224249627.279282813421427.235466482784127.340056918745127.386638279443628.718904159340127.880822586058527.054270436225827.330788555369826.911484991061226.45744721916527.749296531124226.894902725154728.473292465114727.135956052574627.548496295519527.109823160028527.874862211589628.151656017197626.782903173416427.087422726425428.983907307942828.659217445871527.286056112733326.038467053728528.077840808684527.653049185926727.203305361122327.419583420071725.885552544814826.908305104533227.160176891958427.701095777040427.420744663949526.804941733048226.164845192641826.184520820346627.796838708022526.959396341299926.79240564428726.439562527696727.195199427823125.613792387211927.049898886623326.956733206376426.346393739691927.38868873735327.289148054558226.344217083637727.955215348187526.872538206884627.675054936187727.645478463486527.062389706825627.109539813768127.122332949894827.242640951279726.326637776235925.916917988535327.149508960577427.200543554454829.020600154129526.256779068061426.313665075351928.230173701898126.021022182298925.706350938648827.137241259326927.086463100661525.535372452439527.144356522225729.103202406191627.139202045180528.232161959796627.542058525354927.270242231871425.198664649266727.845514988007826.446841283391325.218186864386626.468107957042127.660203570689427.442351770245627.722577808226126.835521924986424.458168045827426.457771895367427.577647294439727.770442834918727.863187461657927.642898952783226.215324235497427.444792358013128.768011759021427.987314931722426.675080444978728.239546874761627.071457135861926.568171993414326.549404003217825.128510470375427.205093462611528.274292446007127.260996667967926.379597209767527.372875545919225.103805557939527.850066832116627.297471975086425.87910081911527.950193274625126.861225329876726.768212966568127.074929720048527.184985579778727.83345144512427.293731951812326.252070006517827.642121564080928.36771220853626.01788265576327.134817099835827.279215455250128.177009956064526.417184391286526.635924497280427.317624741624226.749674936245129.083114294074125.925493308517726.48608664848625.566311342525527.983161675168528.469152026515126.917292415637427.2799338943227.514834337031627.189738260283727.00286982300327.073326538407727.00841803412127.80480770832926.532251056912328.039860979895827.419065835481927.017965531514826.981339124706627.596552476790527.816916563400327.116182846362227.232923044750927.798247864771825.121657343970527.500279079756426.947500879749227.376572220456326.209775150833525.438756110172626.368472364718527.801957412328427.300280902399327.39781148909127.105433333561627.105163534990226.986050487934326.84938756775326.933802204074227.656490960757526.489643028374925.919099677055826.873280244030526.658667973501125.874471453695728.036986941858726.103531486196627.843654831339525.449645372357125.668145120885426.489369114782626.920998500199727.334430631777927.265576219590327.10550527271827.283701877984127.400596268627728.420967673600426.526540344790626.272069421650826.490086385583128.613430789055428.606764431851128.151757532070527.092098188046126.811454838397126.412441591421526.759720827730927.209691619717425.166336332233826.456052562254227.223160489034927.858344818373327.268088352756227.38886500206726.399865110134225.714004664554127.1491362306427.276353363701426.632437311082127.012828411777826.70168117510226.858460097581326.443929426658426.911795560220926.840126056100926.817010526965326.581913106170126.600876983458527.389794631946528.44877068225327.444361654046226.889384500595626.295976443876825.928180605205728.291648403423226.251769594180626.946600771661527.159116266653428.492467215834726.326123704160726.553389129883826.699643330195227.629816489640126.842152099135627.468432489828227.854749907045328.105835258299127.599510456027427.26997476251127.25350981636927.183633235828226.820923405102227.966113431231726.763718971286728.275156902189327.399087289368727.263589467145827.871283569519627.881031775484728.085909875496727.739010449967627.622606883357827.702157752006827.899885888704428.104526345869827.33826192101127.015880517785926.079437292791126.522704806310226.162002034320827.802471403110727.714570939069326.260938466800928.430808530732727.292013346209826.718285608341127.418319362920327.155470201872827.246328242324626.831189919128628.717068918499227.860166316677326.884350415127826.217839436275825.991278022801925.410922250383627.193596075362626.447944628527427.324759219688726.150655076530226.697409355183928.406949258876126.843895228662628.247077157623127.127693093791426.210471219691428.117022589298627.996675294527727.275396371171126.617796637630628.410355798079426.594319951487726.303917825542726.621914277945626.169628969240625.905899344972427.1397025431627

Si tienes dudas sobre el funcionamiento de mvrnorm puedes volver a la pgina 30 del Tutorial06.

2.3. Contrastes para en poblaciones normales con muestras pequeas.

En la Seccin 7.5 del libro (pg. 270) hemos extendido las ideas del contraste de hiptesis al casode la media de poblaciones normales usando muestras pequeas. La nica novedad con respecto alo que ya hemos visto es el uso de la t de Student en lugar de la distribucin normal. As que vamosa limitarnos a proponerte una serie de ejercicios para que te ejercites con ese tipo de problemas.

Ejercicio 9. En los dos casos debes escribir la hiptesis nula, la hiptesis alternativa, calcular elestadstico, el p-valor y la regin de rechazo al 95 %.

1. En un experimento para medir el tiempo de reaccin de las personas se les muestra a lossujetos un crculo de color en la pantalla del ordenador. Cuando el crculo cambia de color,el sujeto debe pulsar la barra de espacio del teclado tan rpido como pueda. En una sesinconcreta del experimento, se midieron estos tiempos de reaccin de un sujeto (en segundos).

0.316, 0.295, 0.304, 0.263, 0.25

El experimentador sospecha que el tiempo de reaccin medio de este sujeto est por debajode los 0.29 segundos. Confirman estos datos sus sospechas?

2. Un laboratorio farmacutico prepara comprimidos que deben contener una dosis de 500mgde cierto principio activo. El sistema de control de calidad del laboratorio ha tomado unamuestra de 15 comprimidos para comprobar si la dosis se ajusta a lo esperado. Los valoresmedidos, en miligramos, son:

491, 503, 492, 502, 490, 500, 500, 501, 501, 501, 505, 491, 501, 493, 492

Utiliza estos valores para comprobar si la dosis es la deseada.


2.4. Contrastes para 2 en poblaciones normales.

Para cerrar el muestrario de contrastes de hiptesis que hemos visto en el Captulo 7, vamos adedicar esta breve seccin a los contrastes de hiptesis sobre la varianza (o desviacin tpica) deuna poblacin normal, que hemos discutido en la Seccin 7.6 del libro (pg. 273). En concreto,vamos a realizar con los clculos necesarios para el Ejemplo 7.6.1 del libro (pg. 274). En eseejemplo queremos contrastar la hiptesis nula

H0 = { 0},

donde 0 = 0.2, y tenemos:

sigma0 = 0.2n = 15s = 0.24

A partir de estos valores calculamos el estadstico y los grados de libertad:

(Y = (n-1) * s^2 / sigma0^2)

## [1] 20.16

k = n - 1

y obtenemos el p-valor mediante

13

(pvalor = 1 - pchisq(Y, df = k))

## [1] 0.12518

y, como indicbamos en el libro, este p-valor es bastante grande, as que no rechazamos H0.

Por supuesto, tambin es posible trabajar a partir de una muestra en bruto. Para que puedaspracticarlo te proponemos un ejercicio:

Ejercicio 10. Supongamos que X es una variable normal y que es la desviacin tpica de X.Queremos contrastar la hiptesis alternativa

Ha = { 6= 3.7}

Para ello hemos tomado una muestra aleatoria que encontrars en el fichero

Calcula el p-valor del contraste (recuerda que es bilateral). Solucin en la pgina 29.

2.5. Ficheros plantilla de comandos R para estos contrastes.

La experiencia que has acumulado en las secciones previas de este tutorial debe servir para ayudartea entender las decisiones que hay que tomar en un contraste de hiptesis sobre la media o lavarianza. Es sencillo, entonces, con un poco de cuidado, automatizar ese proceso de toma dedecisiones, para obtener un programa en R que a partir de los datos del problema calcule el p-valory la regin de rechazo del contraste.

En la Tabla 1 (pg. 14) encontrars una lista con varios de esos programas, que cubren todaslas situaciones que puedes encontrarte al realizar un contraste como los que hemos descrito en elCaptulo 7 del libro. Como hicimos en el caso de los intervalos de confianza, distinguimos entreel caso en el que disponemos de los estimadores de la muestra (n, X, s) y el caso en el quedisponemos de todos los datos de la muestra (muestra en bruto). Todos los ficheros incluyen, alprincipio, un bloque de comandos en el que debes introducir los datos del problema. Si disponesde datos en bruto, ya sea en forma de vector o de fichero csv tendrs que descomentar algunaslneas para usarlas. Y, en cualquier caso, siempre debers indicar el tipo de contraste quequieres realizar, mediante un cdigo numrico (del 1 al 3) que identifica los contrastes unilateraleso bilaterales posibles. Tienes instrucciones detalladas en los comentarios de los ficheros, as que leeesas instrucciones detenidamente antes de usar estos ficheros.

Para practicar el uso de estos ficheros, aqu tienes unos cuantos ejercicios.

Ejercicio 11. En todos los casos, es tarea tuya seleccionar el fichero plantilla adecuado pararealizar el contraste.

Contrastes para la media en poblaciones normales o con muestras suficientemente grandes.

Muestra grande o el caso de conocida.

Estadsticos de la muestra: Datos en bruto:

Muestra pequea.


Contrastes para la varianza o desviacin tpica en poblaciones normales.


Tabla 1: Ficheros plantilla de R para contrastes de hiptesis

14

9.42872977138112.784338989671612.043472846568416.69038150831016.6962970040062812.790048357572912.5795426104913.082023935134313.305813649867119.706386684650815.680011469433111.709026786951513.037496159115911.0230460950568.841723309999115.048123996153810.943380312408518.526400308951412.101467035719914.083424237056311.975917406418615.651376185231416.98117003126710.405303550418811.868299540157320.979534959836219.419635237715812.82258915711336.8288269433892116.626541394224614.585725182496112.425031704534513.4640911993516.0941834332996311.007769042425712.217830633841414.816554268593613.469670135480110.51118287423357.435982407115227.5305095537081515.276529737126111.253225446659610.45095604346538.7558003154417512.38608856346974.78857262172711.688024655974311.24043101137738.3081917403178413.315664615655412.83744369911458.2977344838071316.037414833469510.835934993320514.69144688103714.549353342133311.748034004089911.974556132771312.036017890036512.61401073752478.213278638600766.2448716827928512.166578946798712.411763222957321.15581752130997.87765812130518.1509542026757817.35839066194726.745016965702215.2332494519344312.107641523715611.86368923314.4118216086839612.141825210720421.552661541065412.117061680195517.367942801713814.052495412156612.74661490831872.7941843801781415.51038402237748.790769466966882.887974490366198.8929404374635514.620096821734113.573476638375614.919759876133710.6580985574101-0.7633657033611058.8432831440968314.223473682472115.149716676634915.595287463957314.53696066068757.6784976628149113.585201895690419.942313148779116.1916300932779.8872934005011217.40342197167711.79159643607939.37367568905259.283509083586632.457144339999512.433622237661317.570349286823512.70219666725658.4677103757750213.23969367906332.3384551213156515.532252337929912.87743411099876.06318756215616.013287405823410.781584809460810.334727741755211.808279689055312.337018418117315.45242743244212.85946600682457.8550344897987514.533225870777618.01916361283826.72993381361465

##################################################### www.postdata-statistics.com# POSTDATA. Introduccin a la Estadsitica# Tutorial-07. ## Fichero de instrucciones R para calcular# un contraste de hipotesis para la media de una# poblacion normal N(mu,sigma), a partir de # los valores precalculados la media muestral y valor de # s (o sigma) de una muestra con n datos.## El fichero NO FUNCIONARA si no introduces todos los datos.################################################################################################################################### CASO: sigma conocida o desconocida, pero muestra grande n>30.################################################################# rm(list=ls())# Numero de elementos en la muestra (n = ) #SE SUPONE QUE LA MUESTRA ES GRANDE, salvo que se conozca sigma# Media muestral (xbar = )# Cuasidesviacion tipica muestral (o sigma, si fuera conocida) (s = ) # Valor a contrastar de la media (aparece en la hipotesis nula) (mu0 = ) # Que tipo de contraste estamos haciendo? # Escribe 1 si la HIP. ALTERNATIVA es mu > mu0, 2 si es mu < mu0, 3 si es mu distinto de mu0 (TipoContraste = )#Nivel de significacion (nSig = ) ################################################ NO CAMBIES NADA DE AQU PARA ABAJO############################################### (alfa = 1 - nSig)# Calculo del estadistico del contraste (Estadistico = (xbar - mu0) / (s / sqrt(n)))# Funcion para el calculo del p-valor pValor = function(EstadCon, tipoCon){ if(tipoCon == 1){ (pV = 1 - pnorm(EstadCon)) } if(tipoCon == 2){ (pV = pnorm(EstadCon)) } if(tipoCon == 3){ pV = 2 * (1 - pnorm(abs(EstadCon))) } return(paste("El p-Valor es ", pV, sep="", collapse="")) }# Funcion para el calculo del lmite de la regin de rechazo RegionRechazo=function(alfa, tipoCon){ if(tipoCon == 1){ (regionRech = paste("Valores del Estadistico mayores que ", qnorm(1-alfa)) ) } if(tipoCon == 2){ (regionRech = paste("Valores del Estadistico menores que ", qnorm(alfa)) ) } if(tipoCon == 3){ (regionRech = paste("Valores del Estadistico mas alejados del origen que ", qnorm(1 - alfa/2)) ) } regionRech = paste("La region de rechazo la forman los ", regionRech, sep="", collapse="") return(regionRech) }# Y ahora se aplican ambas funciones para mostrar los resultadospValor(Estadistico, TipoContraste)paste0("El valor del estadstico es ", Estadistico, collapse = "")RegionRechazo(alfa, TipoContraste)

##################################################### www.postdata-statistics.com# POSTDATA. Introduccin a la Estadsitica# Tutorial-07. ## Fichero de instrucciones R para calcular# un contraste de hipotesis para la media de una# poblacion normal N(mu,sigma), a partir de # un fichero con una muestra de esa poblacion.## El fichero no funcionara si no introduces todos los datos.# Adems tendrs que descomentar algunas lineas para elegir # la forma en la que lees los datos.################################################################################################################################### CASO: sigma conocida o desconocida, pero muestra grande n>30.################################################################# rm(list=ls())# Una posibilidad es que tengas la muestra como un vector. #muestra = # Si lees la muestra de un fichero csv:# 1. Recuerda seleccionar el directorio de trabajo.# 2. Ahora introduce entre las comillas el nombre del fichero, y el tipo de separador, etc.#muestra = read.table(file=" ", header = , sep=" ",dec=".")[ , 1]# Si conoces sigma (es poco frecuente), pon su valor aqui. # Descomenta la linea para usarla#sigma = # Valor a contrastar de la media (aparece en la hipotesis nula) (mu0 = ) # Que tipo de contraste estamos haciendo?# Escribe 1 si la HIP. ALTERNATIVA es mu > mu0, 2 si es mu < mu0, 3 si es mu distinto de mu0 (TipoContraste = ) ##Nivel de significacion (nSig = ) ################################################ NO CAMBIES NADA DE AQU PARA ABAJO############################################### # Numero de elementos en la muestra(n= length(muestra)) # Media muestral(xbar = mean(muestra))# Cuasidesviacion tipica muestral (o sigma, si fuera conocida)# Se usa un if-else y exists() para utilizar el que corresponda.(s = sd(muestra))# A partir de aqui el codigo es comun a las dos formas# de introduccion de datos.(alfa = 1 - nSig)# Calculo del estadistico del contraste(Estadistico = (xbar - mu0) / (s / sqrt(n)))# Funcion para el calculo del p-valorpValor = function(EstadCon, tipoCon){ if(tipoCon == 1){ (pV = 1 - pnorm(EstadCon)) } if(tipoCon == 2){ (pV = pnorm(EstadCon)) } if(tipoCon == 3){ pV = 2 * (1 - pnorm(abs(EstadCon))) } return(paste("El p-Valor es ", pV, sep="", collapse=""))}# Funcion para el calculo del lmite de la regin de rechazo RegionRechazo=function(alfa, tipoCon){ if(tipoCon == 1){ (regionRech = paste("Valores del Estadistico mayores que ", qnorm(1-alfa)) ) } if(tipoCon == 2){ (regionRech = paste("Valores del Estadistico menores que ", qnorm(alfa)) ) } if(tipoCon == 3){ (regionRech = paste("Valores del Estadistico mas alejados del origen que ", qnorm(1 - alfa/2)) ) } regionRech = paste("La region de rechazo la forman los ", regionRech, sep="", collapse="") return(regionRech)}# Y ahora se aplican ambas funciones para mostrar los resultadospValor(Estadistico, TipoContraste)paste0("El valor del estadstico es ", Estadistico, collapse = "")RegionRechazo(alfa, TipoContraste)

##################################################### www.postdata-statistics.com# POSTDATA. Introduccin a la Estadsitica# Tutorial-07. ## Fichero de instrucciones R para calcular# un contraste de hipotesis para la media de una# poblacion normal N(mu,sigma), a partir de # los valores precalculados la media muestral y la# cuasidesviacion tipica muestral s de una muestra# con n datos.## El fichero NO FUNCIONARA si no introduces todos los datos.################################################################################################################################### CASO: sigma desconocida, muestra pequea n mu0, 2 si es mu < mu0, 3 si es mu distinto de mu0 TipoContraste = ##Nivel de significacion (nSig= ) ############################################### # NO CAMBIES NADA DE AQU PARA ABAJO ############################################### (alfa = 1-nSig) (k = n - 1)# Calculo del estadistico del contraste(Estadistico = (xbar - mu0) / (s/sqrt(n)))# Funcion para el calculo del p-valorpValor = function(EstadCon, tipoCon){ if(tipoCon == 1){ (pV = 1 - pt(EstadCon, df=k )) } if(tipoCon == 2){ (pV = pt(EstadCon, df=k )) } if(tipoCon == 3){ pV = 2 * (1 - pt(abs(EstadCon), df=k )) } return(paste0("El p-Valor es ", pV, collapse=""))}# Funcion para el calculo del lmite de la regin de rechazo RegionRechazo = function(alfa, tipoCon){ if(tipoCon == 1){ (regionRech = paste("mayores que ", qt(1 - alfa, df=k))) } if(tipoCon == 2){ (regionRech = paste("menores que ", qt(alfa, df=k))) } if(tipoCon == 3){ (regionRech = paste("mas alejados del origen que ", qt(1 - (alfa/2), df=k))) } regionRech = paste0("La region de rechazo la forman los valores del Estadistico ", regionRech, collapse="") return(regionRech)}# Y ahora se aplican ambas funciones para mostrar los resultadospValor(Estadistico, TipoContraste)paste0("El valor del estadstico es ", Estadistico, collapse = "")RegionRechazo(alfa, TipoContraste)

##################################################### www.postdata-statistics.com# POSTDATA. Introduccin a la Estadsitica# Tutorial-07. ## Fichero de instrucciones R para calcular# un contraste de hipotesis para la media de una# poblacion normal N(mu,sigma), a partir de # un fichero con una muestra de esa poblacion.## El fichero no funcionara si no introduces todos los datos.# Adems tendrs que descomentar algunas lineas para elegir # la forma en la que lees los datos.################################################################################################################################### CASO: sigma desconocida, muestra pequea n mu0, 2 si es mu < mu0, 3 si es mu distinto de mu0 (TipoContraste = )##Nivel de significacion(nSig = )################################################ NO CAMBIES NADA DE AQU PARA ABAJO############################################### (alfa = 1 - nSig)# Numero de elementos en la muestra(n = length(muestra)) # Grados de libertad (k = n - 1)# Media muestral(xbar = mean(muestra))# Cuasidesviacion tipica muestral (s = sd(muestra))# Calculo del estadistico del contraste(Estadistico = (xbar - mu0) / (s/sqrt(n))) # Funcion para el calculo del p-valor pValor = function(EstadCon, tipoCon){ if(tipoCon == 1){ (pV = 1 - pt(EstadCon, df=k )) } if(tipoCon == 2){ (pV = pt(EstadCon, df=k )) } if(tipoCon == 3){ pV = 2 * (1 - pt(abs(EstadCon), df=k )) } return(paste0("El p-Valor es ", pV, collapse="")) } # Funcion para el calculo del lmite de la regin de rechazo RegionRechazo = function(alfa, tipoCon){ if(tipoCon == 1){ (regionRech = paste("mayores que ", qt(1 - alfa, df=k))) } if(tipoCon == 2){ (regionRech = paste("menores que ", qt(alfa, df=k))) } if(tipoCon == 3){ (regionRech = paste("mas alejados del origen que ", qt(1 - (alfa/2), df=k))) } regionRech = paste0("La region de rechazo la forman los valores del Estadistico ", regionRech, collapse="") return(regionRech) } # Y ahora se aplican ambas funciones para mostrar los resultadospValor(Estadistico, TipoContraste)paste0("El valor del estadstico es ", Estadistico, collapse = "")RegionRechazo(alfa, TipoContraste)

##################################################### www.postdata-statistics.com# POSTDATA. Introduccin a la Estadsitica# Tutorial-07. ## Fichero de instrucciones R para calcular# un contraste de hipotesis para la VARIANZA de una# poblacion normal N(mu,sigma), a partir de # los valores precalculados la media muestral y valor de # s (o sigma) de una muestra con n datos.## El fichero NO FUNCIONARA si no introduces todos los datos.################################################################# rm(list = ls()) # Numero de elementos en la muestra(n = ) # Cuasidesviacion tipica muestral (s = )# Valor a contrastar de la DESVIACION TIPICA que aparece en la hipotesis nula.# CUIDADO: NO INTRODUZCAS LA VARIANZA POR ERROR(sigma0 = ) # Que tipo de contraste estamos haciendo?# Escribe 1 si la HIP. ALTERNATIVA es sigma > sigma0, 2 si es sigma < sigma0, 3 si es sigma distinto de sigma0 TipoContraste = ##Nivel de significacion(nSig = ) ################################################ NO CAMBIES NADA DE AQU PARA ABAJO###############################################(alfa = 1 - nSig)# Grados de libertad k = n - 1# Calculo del estadistico del contraste (Estadistico = (n - 1) * s^2/sigma0^2)# Funcion para el calculo del p-valorpValor = function(EstadCon,tipoCon){ if(tipoCon == 1){ (pV = 1 - pchisq(EstadCon, df = k)) } if(tipoCon == 2){ (pV = pchisq(EstadCon, df = k)) } if(tipoCon == 3){ if(TipoContraste == 3){ if(s > sigma0){ pV = 2 * (1 - pchisq(EstadCon, df=k)) } else { pV = 2 * (pchisq(EstadCon, df=k)) } } } pV = signif(pV, digits =4) return(paste("El p-Valor es ", pV, sep="", collapse="")) } ## Funcion para el calculo del lmite de la regin de rechazo RegionRechazo = function(alfa, tipoCon){ if(tipoCon == 1){ (regionRech = paste("Valores del Estadistico mayores que ", qchisq(1 - alfa, df = k)) ) } if(tipoCon == 2){ (regionRech = paste("Valores del Estadistico menores que ", qchisq(alfa, df = k)) ) } if(tipoCon == 3){ (regionRech = paste("Valores del Estadistico que no pertenecen al intervalo ", "(", qchisq(alfa/2, df = k), ",", qchisq(1 - alfa/2, df = k), ")") ) } regionRech=paste("La region de rechazo la forman los ", regionRech, sep="", collapse="") return(regionRech) } # Y ahora se aplican ambas funciones para mostrar los resultadospaste0("El valor del estadstico es ", Estadistico, collapse = "") pValor(Estadistico, TipoContraste)RegionRechazo(alfa, TipoContraste)

##################################################### www.postdata-statistics.com# POSTDATA. Introduccin a la Estadsitica# Tutorial-07. ## Fichero de instrucciones R para calcular# un contraste de hipotesis para la VARIANZA de una# poblacion normal N(mu,sigma), a partir de # un fichero con una muestra de esa poblacion.## El fichero NO FUNCIONARA si no introduces todos los datos.# Adems tendrs que descomentar algunas lineas para elegir # la forma en la que lees los datos.################################################################# rm(list=ls())# Una posibilidad es que tengas la muestra como un vector. # muestra = c() # Si lees la muestra de un fichero csv: # 1. Recuerda seleccionar el directorio de trabajo.# 2. Ahora introduce entre las comillas el nombre del fichero, y el tipo de separador, etc.# tabla = read.table(file = "", sep= "", dec="", header = ) # muestra = tabla$# Valor a contrastar de la DESVIACION TIPICA que aparece en la hipotesis nula.# CUIDADO: NO INTRODUZCAS LA VARIANZA POR ERROR(sigma0= ) # Que tipo de contraste estamos haciendo?# Escribe 1 si la HIP. ALTERNATIVA es sigma > sigma0, 2 si es sigma < sigma0, 3 si es sigma distinto de sigma0 TipoContraste = # Nivel de significacion(nSig= ) ################################################ NO CAMBIES NADA DE AQU PARA ABAJO############################################### (alfa=1 - nSig)# Longitud de la muestra(n=length(muestra))# Cuasidesviacion tipica muestral (s=sd(muestra))(alfa = nSig)# Grados de libertadk = n - 1# Calculo del estadistico del contraste(Estadistico = (n - 1) * s^2/sigma0^2)# Funcion para el calculo del p-valorpValor = function(EstadCon,tipoCon){ if(tipoCon == 1){ (pV = 1 - pchisq(EstadCon, df = k)) } if(tipoCon == 2){ (pV = pchisq(EstadCon, df = k)) } if(tipoCon == 3){ if(TipoContraste == 3){ if(s > sigma0){ pV = 2 * (1 - pchisq(EstadCon, df=k)) } else { pV = 2 * (pchisq(EstadCon, df=k)) } } } pV = signif(pV, digits =4) return(paste("El p-Valor es ", pV, sep="", collapse=""))}# # Funcion para el calculo del lmite de la regin de rechazo RegionRechazo = function(alfa, tipoCon){ if(tipoCon == 1){ (regionRech = paste("Valores del Estadistico mayores que ", qchisq(1 - alfa, df = k)) ) } if(tipoCon == 2){ (regionRech = paste("Valores del Estadistico menores que ", qchisq(alfa, df = k)) ) } if(tipoCon == 3){ (regionRech = paste("Valores del Estadistico que no pertenecen al intervalo ", "(", qchisq(alfa/2, df = k), ",", qchisq(1 - alfa/2, df = k), ")") ) } regionRech=paste("La region de rechazo la forman los ", regionRech, sep="", collapse="") return(regionRech)}# Y ahora se aplican ambas funciones para mostrar los resultadospaste0("El valor del estadstico es ", Estadistico, collapse = "")pValor(Estadistico, TipoContraste)RegionRechazo(alfa, TipoContraste)

1. Comprueba los clculos del Ejemplo 7.2.1, pg. 252 del libro.

2. Utiliza los datos del fichero para contrastar la hiptesisnula H0 = { 0}, siendo 0 = 27. Usa un nivel de significacin del 95%. Primero puedessuponer que es conocida, y vale 1. Despus repite el contraste suponiendo que no conocemos. Llegas a la misma conclusin?

3. Comprueba los clculos del Ejemplo 7.5.1, pgina 272 del libro. Ten en cuenta que se hacendos contrastes en ese ejemplo.

4. Utiliza los datos del fichero para contrastar la hiptesisnula H0 = { = 0}, siendo 0 = 2.2. Usa un nivel de significacin del 95%.

5. Comprueba los clculos del Ejemplo 7.6.1, pgina 274 del libro.

6. Usando los datos del fichero , contrasta (al 95%) la hip-tesis nula H0 = 0.56.

2.6. La funcin t.test de R (y sus parientes)

Vamos a ver como usar la funcin t.test de R (que ya conocimos en la pgina 30 del Tutorial06)para realizar un contraste de hiptesis sobre la media.

Una compaa ferroviaria canadiense afirma que sus trenes de mercancas no bloquean los pasosa nivel durante ms de 8 minutos, en promedio. Una muestra aleatoria de 10 tiempos de bloqueodio como resultado estos valores (en minutos):

10.1, 9.5, 6.5, 8.0, 8.8, 12, 7.2, 10.5, 8.2, 9.3

Empezamos por observar que en este caso tenemos todos los valores de la muestra. Si llamamos al tiempo medio de bloqueo, queremos usar estos valores para contrastar la hiptesis nula:

H0 = { 0 = 8}

Y naturalmente la hiptesis alternativa es:

Ha = { > 0 = 8}

Vamos a fijar un nivel de significacin del 95%, es decir, = 0.05. Puesto que se trata de unamuestra pequea (n = 10), usaremos la distribucin t de Student para el clculo del p-valor.

Ejercicio 12. Haz primero los clculos del contraste utilizando el fichero

Tut07-Contraste-Media-UsandoT-DatosEnBruto.R,

sin recurrir a t.test. Solucin en la pgina 30.

Este ejercicio muestra que, con un nivel de significacin 0.05 (mayor que el p-valor), tenemosevidencia emprica para rechazar la hiptesis nula y concluir que los trenes bloquean el paso anivel ms tiempo del que dice la empresa. Veamos ahora como hacer este mismo contraste usandot.test:

datos=c(10.1, 9.5, 6.5, 8.0, 8.8, 12, 7.2, 10.5, 8.2, 9.3)mu0=8(contraste = t.test(datos,mu=mu0,alternative="greater",conf.level = 0.95))

#### One Sample t-test#### data: datos## t = 1.96, df = 9, p-value = 0.041

15

26.579631385415127.278094420443327.123884683492728.091128994805126.010881224249627.279282813421427.235466482784127.340056918745127.386638279443628.718904159340127.880822586058527.054270436225827.330788555369826.911484991061226.45744721916527.749296531124226.894902725154728.473292465114727.135956052574627.548496295519527.109823160028527.874862211589628.151656017197626.782903173416427.087422726425428.983907307942828.659217445871527.286056112733326.038467053728528.077840808684527.653049185926727.203305361122327.419583420071725.885552544814826.908305104533227.160176891958427.701095777040427.420744663949526.804941733048226.164845192641826.184520820346627.796838708022526.959396341299926.79240564428726.439562527696727.195199427823125.613792387211927.049898886623326.956733206376426.346393739691927.38868873735327.289148054558226.344217083637727.955215348187526.872538206884627.675054936187727.645478463486527.062389706825627.109539813768127.122332949894827.242640951279726.326637776235925.916917988535327.149508960577427.200543554454829.020600154129526.256779068061426.313665075351928.230173701898126.021022182298925.706350938648827.137241259326927.086463100661525.535372452439527.144356522225729.103202406191627.139202045180528.232161959796627.542058525354927.270242231871425.198664649266727.845514988007826.446841283391325.218186864386626.468107957042127.660203570689427.442351770245627.722577808226126.835521924986424.458168045827426.457771895367427.577647294439727.770442834918727.863187461657927.642898952783226.215324235497427.444792358013128.768011759021427.987314931722426.675080444978728.239546874761627.071457135861926.568171993414326.549404003217825.128510470375427.205093462611528.274292446007127.260996667967926.379597209767527.372875545919225.103805557939527.850066832116627.297471975086425.87910081911527.950193274625126.861225329876726.768212966568127.074929720048527.184985579778727.83345144512427.293731951812326.252070006517827.642121564080928.36771220853626.01788265576327.134817099835827.279215455250128.177009956064526.417184391286526.635924497280427.317624741624226.749674936245129.083114294074125.925493308517726.48608664848625.566311342525527.983161675168528.469152026515126.917292415637427.2799338943227.514834337031627.189738260283727.00286982300327.073326538407727.00841803412127.80480770832926.532251056912328.039860979895827.419065835481927.017965531514826.981339124706627.596552476790527.816916563400327.116182846362227.232923044750927.798247864771825.121657343970527.500279079756426.947500879749227.376572220456326.209775150833525.438756110172626.368472364718527.801957412328427.300280902399327.39781148909127.105433333561627.105163534990226.986050487934326.84938756775326.933802204074227.656490960757526.489643028374925.919099677055826.873280244030526.658667973501125.874471453695728.036986941858726.103531486196627.843654831339525.449645372357125.668145120885426.489369114782626.920998500199727.334430631777927.265576219590327.10550527271827.283701877984127.400596268627728.420967673600426.526540344790626.272069421650826.490086385583128.613430789055428.606764431851128.151757532070527.092098188046126.811454838397126.412441591421526.759720827730927.209691619717425.166336332233826.456052562254227.223160489034927.858344818373327.268088352756227.38886500206726.399865110134225.714004664554127.1491362306427.276353363701426.632437311082127.012828411777826.70168117510226.858460097581326.443929426658426.911795560220926.840126056100926.817010526965326.581913106170126.600876983458527.389794631946528.44877068225327.444361654046226.889384500595626.295976443876825.928180605205728.291648403423226.251769594180626.946600771661527.159116266653428.492467215834726.326123704160726.553389129883826.699643330195227.629816489640126.842152099135627.468432489828227.854749907045328.105835258299127.599510456027427.26997476251127.25350981636927.183633235828226.820923405102227.966113431231726.763718971286728.275156902189327.399087289368727.263589467145827.871283569519627.881031775484728.085909875496727.739010449967627.622606883357827.702157752006827.899885888704428.104526345869827.33826192101127.015880517785926.079437292791126.522704806310226.162002034320827.802471403110727.714570939069326.260938466800928.430808530732727.292013346209826.718285608341127.418319362920327.155470201872827.246328242324626.831189919128628.717068918499227.860166316677326.884350415127826.217839436275825.991278022801925.410922250383627.193596075362626.447944628527427.324759219688726.150655076530226.697409355183928.406949258876126.843895228662628.247077157623127.127693093791426.210471219691428.117022589298627.996675294527727.275396371171126.617796637630628.410355798079426.594319951487726.303917825542726.621914277945626.169628969240625.905899344972427.1397025431627

1.99 2.12 1.9 2.2 2.23 1.61 2.1 2.05 2.3 1.79 2.02 1.78 1.91 1.85 2.13

3.95 4.39 3.67 4.68 4.75 2.7 4.34 4.16 5.01 3.29 4.06 3.28 3.7 3.5 4.44 3.94 2.75 3.3 3.03 3.37 3.78 3.87 3.87 3.95 3.59 4.25 3.66 3.99 4.58 4.4 4.12 3.34 3.79 4.25 3.96 3.73 3.87 3.04 4.4 3.38 3.12 3.96 4.52 3.87 4.15 5.12 3.95 4.28 3.78 4.52 4.15 3.94 4.52 4.35 4.27 3.25 3.59 3.58 3.21 4.84 4.96 4 3.23 3.71 3.84 3.69 3.98 3.4 4 3.41 3.98 3.53 3.55 3.35 4.33 4.01 4.2 4.58 3.53 4.31 4.08 3.71 3.95 4.12 4.24 3.45 3.44 3.27 3.97 4.24 3.92 3.63 4.04 3.33 4.54 4.84 4.81 3.17 4.38 4.15 4.34 4.15 4.16 4.05 3.41 3.72 4.13 4.48 4.55 3.03 5.22 4.04 3.18 3.49 3.48 4.31 3.85 3.97 4.03 4.84 3.6 4.3 3.59 3.69 4.25 4.45 4.46 3.61 3.4 3.7 4.14 4.48 3.81 3.6 4.68 3.92 3.86 3.72 3.67 4.28 3.99 3.98 3.66 3.19 4.16 4.59 4.31 4.11 3.25 3.58 3.62 4.67 4.66 4.19 4.75 3.26 3.75 4.41 3.92 3.96 4.29 4.87 3.92 4.75 5.07 4.22 3.69 4.11 3.3 4.97 4.61 3.75 3.66 3.68 3.03 4.09 4.11 3.45 4.51 3.47 3.37 3.17 4.21 4.37 4.4 4.82 3.72 4.48 3.22 4.54 4.34 4.08 3.54 4 4.28 4.7 2.98 3.1 4.78 4.53 4.21 4.39 4.96 2.77 3.74 4.33 4.36 3.71 3.45 3.89 3.85 3.67 4.94 3.84 3.31 5.14 4.49 3.12 3.41 3.9 4.11 3.56 4.15 3.96 3.88 4.34 2.84 3.05 3.55 3.65 2.85 4.3 4.48 3.91 3.51 4.61 4.25 4.26 4.33 3.66 3.06 3.51 4.25 3.31 3.75 3.99 3.64 3.76 4.53 3.79

## alternative hypothesis: true mean is greater than 8## 95 percent confidence interval:## 8.064 Inf## sample estimates:## mean of x## 9.01

Como se ve, aparte del vector de datos, le hemos indicado a R el valor de 0 y, mediante las opcionesalternative = c("greater") y conf.level = 0.95, hemos seleccionado un contraste de coladerecha (greater) y el nivel de significacin deseado (mediante conf.level, R usa aqu la mismaterminologa que para los intervalos de confianza, en lugar de hablar de niveles de significacin). Siquieres hacer un contraste de otro tipo, con la cola izquierda o bilateral, debes usar alternative= c("less") o bien alternative = c("two.sided"), respectivamente.

La respuesta de R contiene tanto el valor del estadstico de contraste en la forma t =1.95712 , comoel p-valor, en p-value =0.04101. Adems, para que la interpretacin del resultado sea ms fcil,y para que podamos comprobar que estamos haciendo lo que deseamos, R describe la hiptesisalternativa del contraste. Como subproducto se obtiene lo que R llama un intervalo de confianza.Ten en cuenta, en cualquier caso que nosotros no hemos visto en el curso este caso de los intervalosde confianza unilaterales.

2.6.1. La librera TeachingDemos. Contrastes para y

Despus de conocer t.test seguramente te estars preguntado y no hay algo equivalente parahacer un contraste para la media con la Z, la normal estndar? Lo cierto es que esos contrastes Zson casi exclusivamente ejemplos de libro de texto, que no se usan en las aplicaciones reales. Y nose incluyen en R por defecto (hemos dicho ya que R no se dise pensando en la enseanza?). Peroeso no significa que no estn disponibles. Basta con cargar una librera, cuyo revelador nombre esTeachingDemos (tendrs que instalarla previamente, claro, si no lo has hecho previamente), y coneso ya tenemos disponible la funcin z.test, con la que podemos hacer esos contrastes.

Vamos a usar esa funcin z.test para rehacer el apartado 2 del Ejercicio 11 de la pgina 14 de estetutorial. Recuerda que debes seleccionar como directorio de trabajo aquel que contiene la carpetadatos, que a su vez debe contener el fichero:

Tut07-Contraste-Media-UsandoT-datos.csv

Una vez hecho esto, vamos a mostrar el cdigo que permite realizar el contraste (se muestra tambinla salida), y a continuacin lo comentaremos:

library(TeachingDemos)muestra = read.table(file="../datos/Tut07-Contraste-Media-UsandoZ-datos.csv",sep=" ",dec=".")[,1]mean(muestra)

## [1] 27.1

(contraste = z.test(muestra, mu = 27, stdev = 1,alternative="greater", conf.level = 0.95))

#### One Sample z-test#### data: muestra## z = 1.73, n = 300.0000, Std. Dev. = 1.0000, Std. Dev. of the## sample mean = 0.0577, p-value = 0.042## alternative hypothesis: true mean is greater than 27## 95 percent confidence interval:## 27.005 Inf## sample estimates:## mean of muestra## 27.1

16

Puedes ver que el p-valor (que es aproximadamente 0.04163) permite rechazar H0, pero po rmuypoco margen. Como ves, la llamada a la funcin z.test incluye el argumento stdev=1, que repre-senta el valor de , la desviacin tpica de la poblacin que en este caso se supone conocida(ya sabes que eso sucede muy pocas veces en la prctica). El argumento mu=7 se usa para indicarlea R el valor que nosotros llamamos 0 en los contrastes. Enseguida volveremos con la segundaparte de este ejercicio, en la que se supone que es desconocida. Pero antes, vamos a hacernosalgunas preguntas sobre este primer clculo, en forma de ejercicios.

Ejercicio 13.

1. En la salida de z.test para este ejemplo se incluye un intervalo de confianza unilateral, quees (27.00503,). Qu relacin hay entre este intervalo y la regin de rechazo para este tipode contrastes, que aparece en la Ecuacin 7.4 (pg. 257) del curso?

2. Qu ocurre si haces este contraste usando la t de Student (con el fichero adecuado de laTabla 1, pg. 14)? Qu p-valor obtienes?

Volvamos a la segunda parte del Ejercicio 2 de la pgina 14. Ahora ya no suponemos conocidoy por esa razn tenemos que cambiar la forma en la que llamamos a z.test. La nueva versin esesta:

z.test(muestra, mu = 27, sd = sd(muestra),alternative = "greater", conf.level = 0.95)

#### One Sample z-test#### data: muestra## z = 2.17, n = 300.0000, Std. Dev. = 0.8000, Std. Dev. of the## sample mean = 0.0462, p-value = 0.015## alternative hypothesis: true mean is greater than 27## 95 percent confidence interval:## 27.024 Inf## sample estimates:## mean of muestra## 27.1

en la que, como puedes ver, hemos cambiado el argumento stdev = 1.5 por sd = sd(muestra),indicndole a la R que utilice la cuasidesviacin tpica muestral en lugar de . El p-valor esligeramente distinto, claro, y ahora nos permite rechazar H0 con ms claridad.

Como hemos visto, la funcin z.test trabaja a partir de un vector de datos. Si lo que tenemosson los estimadores (o descriptores) de una muestra, como n, X, s, entonces debemos utilizar elmtodo que vimos en la pgina 30 del Tutorial06, basado en la funcin mvrnorm.

Para terminar con esta visita a la librera TeachingDemos, vamos a presentar la funcin sigma.testque, como su nombre sugiere, sirve para realizar un contraste de hiptesis sobre la desviacin tpica de una poblacin normal. En el siguiente fragmento de cdigo R hemos usado esta librera paraobtener el contraste que se peda en el apartado 6 del Ejercicio 11 (pg. 14).

muestra = read.table(file="../datos/Tut07-Contraste-Varianza-datos.csv",sep=" ",dec=".")[ ,1]sigma.test(muestra,sigma=0.56,alternative="less",conf.level=0.95)

#### One sample Chi-squared test for variance#### data: muestra## X-squared = 214, df = 249, p-value = 0.055## alternative hypothesis: true variance is less than 0.3136## 95 percent confidence interval:## 0.00000 0.31506

17

## sample estimates:## var of muestra## 0.2701

El modo de usar de la funcin sigma.test, como ves, es muy fcil de entender. La nica precaucinque debemos tener es la de utilizar el argumento sigma= cuando la hiptesis est formulada entrminos de la desviacin tpica, mientras que se usa sigmasq= cuando es la varianza 20 la queaparece en las hiptesis del contraste. Por ejemplo, se obtiene exactamente el mismo resultado deantes si se usa esta otra versin:

sigma.test(muestra,sigmasq=0.56^2,alternative="less",conf.level=0.95)

Ejercicio 14.

1. Ejecuta ese comando y comprueba que la respuesta es la misma.

2. Para realizar un contraste sobre la media, en el Ejercicio 11 (pg. ) hemos supuesto primeroque = 1 era conocido, y luego hemos usado el valor de s obtenido en la muestra. Usa lafuncin sigma.test para contrastar la hiptesis Ha = { 6= 1} al 95%.

2.6.2. La librera asbio

En la Seccin 7 del Tutorial06 tambin aprendimos a usar la librera asbio para obtener intervalosde confianza. Esa librera incluye, adems, funciones para algunos de los contrastes de hiptesisque estamos viendo. Concretamente, se incluyen entre otras las dos funciones:

one.sample.z, para contrastes sobre usando Z.

one.sample.t, para contrastes sobre usando la t de Student.

Una ventaja de estas funciones de asbio es que son capaces de funcionar tanto con datos en bruto,como con los valores de n, X y s. Vamos a dejar que el lector explore esas dos funciones por simismo:

Ejercicio 15.

1. Lee la descripcin de estas dos funciones en la ayuda de la librera asbio. Si ests en RStudio,ve al panel Packages y haz clic sobre el nombre de la librera asbio.

2. salas para volver a hacer algunos de los Ejercicios previos y comprueba que obtienes losmismos resultados.

2.7. Contrastes de hiptesis para y (una poblacin normal) usandootros programas

Hojas de clculo: desaconsejamos su uso

Empecemos por lo ms fcil. Calc no incluye funciones para realizar los contrastes que hemos visto,no en el sentido de que sean mnimamente comparables con lo que podemos hacer en R. Existendos funciones, PRUEBA.T y PRUEBA.Z, pero slo las mencionamos para recomendar al lector que nogaste demasiado tiempo tratando de aprender a usarlas: son muy limitadas. Las ltimas versionesde otras hojas de clculo ms sofisticadas, como Excel en Microsoft Office 2013, incluyen algunasfunciones adicionales para estos contrastes. Pero estas tareas se realizan con mucha ms facilidadusando software estadstico como R.

18

Wolfram Alpha.

Por contra, Wolfram Alpha es capaz de realizar muchos de estos contrastes, con una sintaxisbastante sencilla. Prueba a utilizar el comando:

z.test for population mean

y llegars a un cuadro de dilogo en el que puedes introducir los valores concretos de la muestra,como puedes ver en la Figura 1 (pg. 19), en la que hemos usado los valores del Ejemplo 7.2.1 dellibro.

Por supuesto, tambin existe una interfaz similar para el contraste basado en la t de Student, queencontrars usando:

t-test for population mean

No he encontrado informacin sobre una implementacin equivalente para el contraste de hiptesissobre , usando 2. Naturalmente, es posible usar Wolfram Alpha para calcular la probabilidadde una cola de la distribucin 2, como en este ejemplo donde el comando:

P[X>23] for X chi-squared with 20 dof

permite calcular la probabilidad P (220 > 23), como se ve en la Figura 2 (pg. 20). A partir deaqu, el clculo de p-valores es fcil, aunque ms laborioso, claro.

Figura 1: Wolfram Alpha para un contraste de hiptesis sobre la media.

19

Figura 2: Wolfram Alpha para clculos de probabilidad con 2.

3. Ejercicios adicionales y soluciones.

Ejercicios adicionales

Ejercicio 16. Cada uno de los siguientes ficheros contiene una muestra de una poblacin normal.Usa los datos del fichero para contrastar la hiptesis nula que se indica, al correspondiente nivelde significacin. Calcula siempre el p-valor del contraste.

1. FicheroHiptesis nula: H0 = { 6= 12.5}. Nivel de significacin: 95 %.

2. FicheroHiptesis nula: H0 = { < 4.1}. Nivel de significacin: 95 % y tambin 90 %.

3. FicheroHiptesis nula: H0 = {2 6= 1.95}. Nivel de significacin: 95 %.

Soluciones de algunos ejercicios

Ejercicio 1, pg. 3

1. A partir de los datos de la muestra calculamos el valor del estadstico:

mu0 = 2.5barX = 2.52n = 10000s = 0.5(estadistico = (barX - mu0) / (s/sqrt(n)))

## [1] 4

20

10.447221875934512.553783059625512.088687228184515.00589145972178.7318741014015812.557367247181912.42521740287612.74066165909512.881150820882916.899258363012914.371608333587311.878730990316512.712708319342111.448090768436110.078715013042813.974926378961811.398078733518916.158494664193812.125094419784813.369313825702112.046277740455414.353631872605415.18844067069211.060288619439111.978718139503617.698506595783916.719243519750512.57779548561458.8150728315931814.965814353733913.684644844709712.328219613273812.98051320794968.3538834017365111.43850024582812.198144355892213.829553134444212.984015513948711.12675681021889.196228696042349.2555702953955414.118313357827511.592591172336611.088948026281310.024774868840512.30377215708887.5342560620347611.865546417556911.5845591701049.7437782484045912.887334992161912.58712076741759.7372134641224114.595976549497511.330627453040113.751014082583413.661811581923911.903218671736512.04542316948512.084007207051312.44685556565439.684194356808668.4484814304612212.165969925706912.319890017531617.80917204494829.473500826009069.6450687527903615.42524963341248.762459182530867.8134122118914812.128970597222311.97582391277467.297741912631812.150430196202818.058300043357612.134884318008615.431246209755113.349897541578312.53010089632856.282232783532514.26512078619710.04672756131376.3411116912608910.110867747654613.706222435045313.049182443525113.894342838083811.21898652331184.0488985579106910.079694234921613.457233099466814.0387035303914.318420882471313.65403178994069.3484732486336313.056543244596217.047366649528914.692788740402410.735095784520615.453519078081611.930565994480710.412660404293310.35605623533816.070648114459612.333612518840315.55831155530712.50221631967429.8439197558536112.83964248218755.9961382163346414.27884912632812.61222567204588.3344250277846414.580829999576111.296507869919111.015983025620911.941039291831812.272967240081814.228737198372912.60094577968199.4592983188441513.651687189320715.84006511371118.7529903854664712.121659343754612.557164095258315.26490802943869.9572825161160710.617001632940512.673006319844710.960072414547617.99771439298228.4743445546449910.16509139533527.3910534576287314.680262538436816.146007121117111.46560593327112.559330904067913.267789519387712.287301301826311.723706985891211.936204103646211.74044036417214.142347824759310.304323031058114.85126737117812.978952175294511.769235570793511.658770502478113.514251039305614.178868073924912.065458524117712.41754640589414.12256336786536.0499791178948313.223890932838611.556714517011712.85079163496739.331737235742837.006347484977619.8103672762238214.133751345610712.620697383429712.914849167910412.033038044760112.032224333554711.672979951511111.260805235790911.51539937648513.695025221190510.17581742012518.455061392637711.332865433534610.68559584879158.3204628837507114.84259928616019.0113068497193214.25951056255367.039189447811047.6981836476651110.174991298036511.476783466641812.723692804425312.516028225534112.033255012912512.570695124834812.923248049716616.000683342447410.28709955052529.5196164595371510.177154583351216.581151181083216.561045479537315.188746839064911.992819309461211.14640030489959.9429782543349110.9903707753745

-6.1148683500883-4.80065350897712-5.09081163443339-3.2708630256201-7.18501790017555-4.79841745121796-4.88086143052508-4.68406604367572-4.59641943608305-2.08965314515785-3.66657158812746-5.22179648591844

1.354420808020772.302003832942812.092792290336063.405022493492070.5828151952480032.303616088647932.244171838853582.386066422697842.449261902575854.256705488222113.11970634508271.998348811304712.373492323049221.804636249209751.188657358780872.941269046699851.782139606009353.923491759651652.10916914044262.668849627035482.073715459822483.111620090856373.487137617831981.630193305770552.043325489890444.616226998414264.175730384802342.312805212665640.6202400301091913.386994825643632.810693273997272.200539847723422.493957547795690.41278568300121.800322196290732.142028798145812.875876586300772.495532971162711.660092332567290.7916933113135270.8183866220296683.005768035962491.869636084434391.643085011759571.164393755424072.189542780720210.04409714934913021.992418066242761.866023092307381.037994565290422.452043694898132.316999953747711.035041563879293.220632686256421.751798361289852.840547789343472.800422310881222.009363972607842.073331052784442.09068710173942.25390521659641.011192265565060.4553382026738362.127555948215752.196792990717394.666007038930220.9164171340415680.993592606701793.593660112863460.5965731168874690.1696684505554612.110912740376812.04202359553297-0.06229273140213072.120565795732144.778070939164012.113572877416583.596357520370042.660115704951812.29135101350069-0.5190937110450863.071805627527541.17426861635857-0.4926085304002891.203120449508492.820399404765782.524846658669642.905020588304561.70157952562722-1.523702367826961.189097836862962.708397878483332.969957577818273.095781321586312.796922769126710.8601766550631692.528157728008024.323328237772113.264181190528331.483913571490483.606376404277092.021665470902851.338874208141741.31341226093746-0.6142696984787512.20296570926943.653514637586982.278807845184781.083040678018332.43059043105869-0.6477860830008363.077980972525462.328292757228680.404032827877823.213819395618211.73645053373411.61026356010912.026376617610392.175685971496733.055439394980012.323218784248570.9100284970511052.795868110109513.780254317033330.5923138191114982.107623958768912.303524705916783.521534516279471.134034035398441.430791917941432.355633387324741.585113592296024.750818023704430.466972071956971.22751157970175-0.0203189037474253.258546596840173.917874555682411.812515001084992.304499389805472.623181497372152.18213378497231.928615201767932.024201631057721.93614228682543.01657933024341.290141393430673.335468775953542.493255356918561.94909507889475

Y ahora el p-valor es inmediato:

(pValor = 1 - pnorm(estadistico))

## [1] 0.000031671

2. En la Ecuacin 7.4 del libro (pg. 257) hemos visto que la regin de rechazo se define as:

R =

X 0sn

> z

Despejando de aqu X se obtiene:

X > 0 + z sn

Recordemos que en este ejemplo 0 = 2.5, n = 100, s = 0.5, as que

mu0 = 2.5n = 100s = 0.5nc = 0.95alfa = 1 - nczAlfa = qnorm(1 - alfa)

mu0 + zAlfa * s /sqrt(n)

## [1] 2.5822

En consecuencia rechazaremos H0 con cualquier valor de X mayor que 2.58224.

3. La hiptesis nula es:H0 = { > 25}

y para realizar el contraste calculamos el estadistico a partir de los datos muestrales:

mu0 = 25n = 200barX = 26s = 7(Estadistico = (barX - mu0)/(s / sqrt(n)))

## [1] 2.0203

Y a partir de aqu el p-valor:


## [1] 0.021676

Puesto que el p-valor es menor que 0.05 rechazamos la hiptesis nula al 95 %. Pero como elp-valor es mayor que 0.01, no rechazamos H0 al 99 %.

Ejercicio 2, pg. 3

1. La flecha roja indica el resultado que obtenemos con Wolfram Alpha.

21

2. Y aqu est el resultado en la Calculadora de Probabilidades de GeoGebra.

3. Lo ms parecido a hacer ese ejercicio con R es ejecutar estos comandos, uno tras otro, en laLnea de entrada de GeoGebra:

mu0 = 25n = 200barX = 26s = 7estadistico = (barX - mu0)/(s / sqrt(n))1 - Normal[0, 1, estadistico]

22

Todos deberan resultar evidentes, salvo quiz el ltimo. La funcin Normal es la versinGeoGebra de la funcin pnorm de R. Si adems tienes la precaucin de seleccionar un nmeroalto de cifras para el redondeo, obtendrs el p-valor deseado en la Vista Algebraica:

Otra posibilidad, dentro de GeoGebra, es usar la pestaa Estadsticas de la Calculadora deProbabilidades, como se muestra en esta figura:

El resultado es, evidentemente, el mismo.

Ejercicio 3, pg. 5

El clculo de la potencia es:

n = 200delta = 0.2s = 7alfa = 0.05(zAlfa = qnorm(1- alfa))

## [1] 1.6449

23

(potencia = 1 - pnorm(zAlfa - delta / (s / sqrt(n)) ))

## [1] 0.10734

La bajsima potencia que se obtiene se puede atribuir a la elevada dispersin con s = 7. Si rehaceslos clculos con s = 1 vers que la potencia se eleva hasta casi el 90 %.

El tamao muestral, si se desea una potencia del 80% se obtiene con estos clculos:

potenciaDeseada = 0.80delta = 0.2s = 7alfa = 0.05


## [1] 1.6449

(zPot = qnorm(1 - potenciaDeseada))

## [1] -0.84162

(tamannoMuestra = ( (s / delta) * (zAlfa - zPot))^2)

## [1] 7573.6

De nuevo, a causa de la elevada dispersin, necesitamos un tamao muestral muy grande.

Ejercicio 4, pg. 6Introducimos el resto de los datos:

mu0 = 1000n = 100(s = sqrt(36.1))

## [1] 6.0083

y ahora vamos calculando el valor del estadstico para cada valor de X:

Xbar = 990(Estadistico = (Xbar - mu0) / (s / sqrt(n)))

## [1] -16.644

Xbar = 999.99(Estadistico = (Xbar - mu0) / (s / sqrt(n)))

## [1] -0.016644


## [1] 0.83218

La figura que pide el ejercicio podra ser algo como esto:

24

que indica, en trminos muy generales, por dnde est la regin de rechazo de H0.

Vamos a calcular el p-valor para la media muestral original X = 998.5:


## [1] -2.4965

En este caso, los valores favorables a Ha son los de la cola izquierda del estadstico. Por eso elp-valor es:

(pValor = pnorm(Estadistico))

## [1] 0.0062707

Ejercicio 5, pg. 8

Deshaciendo la tipificacin es:

mu0 = 1000n = 100(s = sqrt(36.1))

## [1] 6.0083

nc = 0.99(alfa = 1 - nc)

## [1] 0.01

(zUnoMenosAlfa = qnorm(alfa))

## [1] -2.3263

(destipificado = mu0 + zUnoMenosAlfa * s / sqrt(n))

## [1] 998.6

25

Si el peso medio muestral es menor que esta cantidad, el inspector rechazar H0 y concluir queel fabricante est incluyendo menos peso del que anuncia.

Ejercicio 6, pg. 9

El valor del estadstico para X = 1000.3 se obtiene con:

mu0 = 1000n = 100(s = sqrt(36.1))

## [1] 6.0083

Xbar = 1000.3(Estadistico = abs(Xbar - mu0) / (s / sqrt(n)))

## [1] 0.49931

Para que el estadstico valga 2, puesto que interviene el valor absoluto, puede ser

X 0sn

= 2,

pero, claro, tambin:X 0sn

= 2.

Sustituyendo los valores muestrales se obtienen los dos posibles valores de X:

mu0 + c(-2, 2) * (s/sqrt(n))

## [1] 998.8 1001.2

La cola derecha, los valores positivos del estadstico, corresponde a medias muestrales superioresa lo que anuncia el fabricante. Es decir a exceso de producto envasado. La cola izquierda, la delos valores negativos del estadstico, corresponde a medias muestrales menores de lo anunciado yrepresenta el riesgo de sufrir la sancin del inspector.

Ejercicio 7, pg. 10

1. La razn para usar 1 - pnorm es que queremos calcular la probabilidad de la cola derecha.Y luego la multiplicamos por 2 para obtener la suma de las probabilidades de ambas colas.De hecho, si te equivocas aqu, y usas pnorm, obtendrs un p-valor mayor que 1, que no tienesentido (recuerda que un p-valor es siempre una probabilidad).

2. El estadstico que usa el inspector es:

mu0 = 1000n = 100Xbar = 999.7(s = sqrt(20.2))

## [1] 4.4944


## [1] -0.66749

26

y el p-valor se calcula con:

pnorm(Estadistico)

## [1] 0.25223

Aunque el peso muestral es menor de 1000 gramos, el p-valor es muy alto, as que el inspectorno rechaza H0 y por tanto, ahora, no tiene razones basadas en los datos para sospechar queel fabricante est envasando menos producto del anunciado.

3. Si hacemos X = 999.1 entonces el inspector calcula el p-valor as:


## [1] -2.0025

(pValorInspector = pnorm(Estadistico))

## [1] 0.022617

El fabricante, por su parte, calcula el p-valor as:

Xbar = 999.1(Estadistico = abs(Xbar - mu0) / (s / sqrt(n)))

## [1] 2.0025

(pValorFabricante = 2 * (1 - pnorm(Estadistico)))

## [1] 0.045234

Si estuviramos usando un nivel de significacin del 95%, ambos rechazaran la hiptesisnula, pero por un margen distinto.

4. Los clculos anteriores indican que, en efecto, eso puede suceder. Dejamos para el lector latarea de experimentar con el cdigo para buscarlos.

Ejercicio 8, pg. 12

El cdigo para el clculo del p-valor es:

datos = read.table(file = "../datos/Tut07-Ejercicio-ContrasteMedia.csv")[ ,1](n = length(datos))

## [1] 300

(Xbar = mean(datos))

## [1] 27.1

(s = sd(datos))

## [1] 0.8

mu0 = 27(Estadistico = (Xbar - mu0) / (s / sqrt(n)))

27

Tutorial 07: Contraste de Hipótesis. - PostData-Statistics · Tutorial 07: Contraste de ......

Documents

Transcript of Tutorial 07: Contraste de Hipótesis. - PostData-Statistics · Tutorial 07: Contraste de ......