UAP NOCIONES DE PRUEBA DE HIPÓTESIS.pdf

19
1 NOCIONES DE PRUEBA DE HIPÓTESIS 1 Conceptos básicos Prueba de Hipótesis Una Prueba de Hipótesis es hacer una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar basada en alguna creencia o experiencia pasada que será contrastada con la evidencia que nosotros obtengamos a través de la información contenida en la muestra. La prueba de hipótesis involucra una suposición elaborada sobre algún parámetro de la población. Se usa una muestra aleatoria para decidir si se rechaza o no la suposición planteada. Para tomar esta decisión se establece una regla antes de seleccionar la muestra. Hipótesis nula H 0 Es la hipótesis que se acepta inicialmente como verdadera y cuya validez será sometida a la comprobación experimental. Hipótesis alterna H 1 Es la negación de la hipótesis nula. Es la hipótesis que se acepta en caso se rechace H 0 . (H 1 es generalmente la hipótesis de investigación). Ejemplo 1 H 0 : El tiempo medio de atención a un cliente en el módulo de información es de 2,8 minutos o menos. H 1 : El tiempo medio de atención a un cliente en el módulo de información es de más de 2,8 minutos. H0: μ ≤ 2,8 minutos H1: μ > 2,8 minutos Ejemplo 2 H 0 : El porcentaje de personas que votará por un candidato es del 50%. H 1 : El porcentaje de personas que votará por un candidato es menor al 50%. H 0 : p = 0,50 H 1 : p 0,50 Contraste de hipótesis El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta, significa que los datos de la muestra no proporcionan evidencia suficiente que contradiga lo supuesto en la hipótesis nula. La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis alternativa se especifica como opción posible si se rechaza la hipótesis nula. Tipos de errores Error tipo I Es el error que se comete al rechazar la hipótesis nula cuando ésta es realmente verdadera. La probabilidad de cometer el error tipo I ( ) se define como: = P (Rechazar H 0 / H 0 es cierta) se denomina el nivel de significación de la prueba. El valor es fijado por la persona que realiza la investigación, por lo general, en 1%, 5% ó 10%. También se le llama riesgo Error tipo II Es el error que se comete al no rechazar la hipótesis nula H0 cuando ésta en realidad es falsa. La probabilidad de cometer el error tipo II (β) se define como: β = P (No Rechazar H 0 / H 0 es falsa) Decisión Rechazar H 0 No rechazar H 0 H0 cierta Error tipo I Decisión correcta H0 falsa Decisión correcta Error tipo II

Transcript of UAP NOCIONES DE PRUEBA DE HIPÓTESIS.pdf

  • 1

    NOCIONES DE PRUEBA DE HIPTESIS

    1 Conceptos bsicos

    Prueba de Hiptesis

    Una Prueba de Hiptesis es hacer una afirmacin acerca del valor que el parmetro de la

    poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada en alguna creencia

    o experiencia pasada que ser contrastada con la evidencia que nosotros obtengamos a

    travs de la informacin contenida en la muestra.

    La prueba de hiptesis involucra una suposicin elaborada sobre algn parmetro de la

    poblacin. Se usa una muestra aleatoria para decidir si se rechaza o no la suposicin

    planteada. Para tomar esta decisin se establece una regla antes de seleccionar la muestra.

    Hiptesis nula H0 Es la hiptesis que se acepta inicialmente como verdadera y cuya

    validez ser sometida a la comprobacin experimental.

    Hiptesis alterna H1 Es la negacin de la hiptesis nula. Es la hiptesis que se acepta en

    caso se rechace H0. (H1 es generalmente la hiptesis de investigacin).

    Ejemplo 1 H0: El tiempo medio de atencin a un cliente en el mdulo de informacin es de 2,8

    minutos o menos.

    H1: El tiempo medio de atencin a un cliente en el mdulo de informacin es de ms de 2,8

    minutos.

    H0: 2,8 minutos H1: > 2,8 minutos

    Ejemplo 2 H0: El porcentaje de personas que votar por un candidato es del 50%.

    H1: El porcentaje de personas que votar por un candidato es menor al 50%.

    H0: p = 0,50

    H1: p 0,50

    Contraste de hiptesis

    El hecho de no rechazar la hiptesis nula no implica que sta sea cierta, significa que los

    datos de la muestra no proporcionan evidencia suficiente que contradiga lo supuesto en la

    hiptesis nula.

    La hiptesis que se contrasta es rechazada o no en funcin de la informacin muestral. La

    hiptesis alternativa se especifica como opcin posible si se rechaza la hiptesis nula.

    Tipos de errores

    Error tipo I

    Es el error que se comete al rechazar la hiptesis nula cuando sta es realmente verdadera.

    La probabilidad de cometer el error tipo I ( ) se define como: = P (Rechazar H0/ H0 es cierta) se denomina el nivel de significacin de la prueba.

    El valor es fijado por la persona que realiza la investigacin, por lo general, en 1%, 5% 10%. Tambin se le llama riesgo

    Error tipo II

    Es el error que se comete al no rechazar la hiptesis nula H0 cuando sta en realidad es

    falsa.

    La probabilidad de cometer el error tipo II () se define como:

    = P (No Rechazar H0/ H0 es falsa)

    Decisin

    Rechazar H0 No rechazar H0

    H0 cierta Error tipo I Decisin correcta

    H0 falsa Decisin correcta Error tipo II

  • 2

    PASOS A SEGUIR EN UNA PRUEBA DE HIPTESIS

    Paso 1: Plantear hiptesis acerca del parmetro . En este curso puede ser , (media

    poblacional), 2 (varianza poblacional) o p (proporcin poblacional) 1 - 2 (diferencia

    de medias poblacionales) o p1 - p2 (diferencia de proporciones poblacionales) o 2

    2

    2

    1

    cociente de varianzas poblacionales

    Paso 2: Fijar el nivel de significacin.

    Paso 3: Establecer las regiones crticas

    Regin crtica La regin crtica o de rechazo de la hiptesis nula H0 es un intervalo de

    valores de la estadstica de la prueba que depende del nivel de significacin y de la hiptesis alterna H1.

    *Intervalos de valores de la estadstica que se observaran con una probabilidad muy baja

    en el caso en que la hiptesis nula fuera cierta.

    *La regin crtica se usa para establecer la regla de decisin para la prueba.

    Paso 4: Calcular el valor del estadstico de prueba con los datos de la muestra, y la regla

    de y la regla de decisin. Tomar la decisin

    Regla de decisin

    Sea Zc Tc Fc el estadstico de prueba (valor calculado)

    Si el estadstico de prueba pertenece a la regin crtica o regin de rechazo se rechaza H0

    Si el estadstico de prueba no pertenece a la regin crtica no se rechaza H0

    Paso 5. Conclusin dar las conclusiones en el contexto del problema.

    Uso de valores p para la toma de decisiones

    En la estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del

    valor P. La aproximacin se disea para dar al usuario una alternativa a la simple

    conclusin de rechazo o no rechazo

    Un valor Pe s el nivel (de significancia) ms bajo en el que el valor observado de la estadstica de prueba es significativo.

    El valor P es el nivel de significancia ms pequeo que conduce al rechazo de la hiptesis nula Ho.

    El valor P es el mnimo nivel de significancia en el cual Ho sera rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto dado

    de informacin. Una vez que el valor de P se haya determinado, la conclusin en

    cualquier nivel particular resulta de comparar el valor P con

    1. Valor P rechazar Ho al nivel 2. Valor P > No rechazar Ho al nivel

    Clculo del valor p

    A continuacin se da la forma de como hallar el p de la prueba dependiendo del

    parmetro que se est contrastando

    Unilateral

    )(1 czzPp

    Unilateral

    )( czzPp

    Bilateral

    )(12 czzPp )(1 1 cn ttPp

    )( 1 cn ttPp

    )(12 1 cn ttPp

  • 3

    2. PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL

    Caso 1 Prueba de hiptesis para con varianza 2 conocida .Poblacin normal o n30

    Procedimiento para realizar la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    01

    00

    :

    :

    H

    H

    Unilateral

    01

    00

    :

    :

    H

    H

    Bilateral

    01

    00

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los puntos crticos3. Regiones crticas

    4. Clculos: estadstico de la prueba

    n

    xzc

    /

    0

    1zzc 1zzc

    2/1

    2/1

    zz

    zz

    c

    c

    5. Conclusiones.

    Ejemplo 1 a. Se trata de probar si el tiempo medio de lmparas fluorescentes

    producidas por una cierta empresa que se mantienen encendidas antes de echarse a perder

    es a lo ms 1550horas con una desviacin estndar de 120 horas. Para ello se toma una

    muestra de 102 lmparas y se dejan encendidas hasta que se apagan. El resultado de la

    muestra dio una duracin por da de 1500 horas Utilice un riesgo del 2%

    b. Halle el p de la prueba

    c. Qu tipo de error se comete?

    Solucin

    PRUEBA DE HIPTESIS UNILATERAL

    1.

    01

    00

    :

    :

    H

    H

    ?1550:0 H El tiempo medio de lmparas fluorescentes producidas por una cierta empresa que se mantienen encendidas antes de echarse a

    perder es a lo ms 1550 horas

    1550:1 H El tiempo medio de lmparas fluorescentes producidas por una cierta empresa que se mantienen encendidas antes de echarse a

    perder es ms de 1550 horas

    2. 02.0

    Como alfa =0.02 99.02

    101.02

    Buscamos en la tabla Z el valor crtico 33.299.01 ZZ

    3. Regin crtica o regin de rechazo

    4. Estadstico de la prueba

    n =102 15501500120 0 x

    208.4

    102

    120

    15501500

    /

    0

    n

    xzc

    Decisin Como ZC < 2.32 NO se rechaza Ho.

    5. Al nivel de significancia del 2% hay suficiente evidencia para aceptar que el tiempo

    medio de las lmparas fluorescentes producidas por una cierta empresa que se mantienen

    encendidas antes de echarse a perder es a lo ms 1550 horas

    b. Usando el p de la prueba

    05.0101)208.4(1)(1 zPzzPp c No se rechaza H0

    c) Se comete Error tipo II

    RRRR

    RRRA

  • 4

    Ejemplo 2 Un fabricante de detergente afirma que el contenido de los paquetes que

    vende pesa, por trmino medio, al menos 200 gramos. Se sabe que la distribucin de los

    pesos es normal, con desviacin tpica de cuatro gramos. Una muestra aleatoria de 16

    paquetes da un peso medio muestral de 198,4 gramos. Contrastar, al nivel de significacin

    del 10% la afirmacin del fabricante.

    Solucin

    Caso 2 Varianza 2 desconocida y X tiene Poblacin normal

    A continuacin consideramos el caso donde la desviacin estndar de la poblacin se estima mediante la desviacin estndar muestral s. En este caso se puede utilizar la

    distribucin t para hacer inferencias acerca del valor de la media de la poblacin.

    Procedimiento para realizar la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    01

    00

    :

    :

    H

    H

    Unilateral

    01

    00

    :

    :

    H

    H

    Bilateral

    01

    00

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los puntos crticos3. Regiones crticas

    4. Clculos. Hallar el valor del estadstico de la prueba

    ns

    xtc

    /

    0

    1,1 nc tt 1,1 nc tt

    1,2/1

    1,2/1

    nc

    nc

    tt

    tt

    5 Conclusiones.

    Ejemplo3 Una compaa que se dedica a la venta de franquicias afirma que, por

    trmino medio, los delegados obtienen durante el primer ao un rendimiento del 10% (para

    clculo tomar 10) en sus inversiones iniciales. Una muestra aleatoria de 10 de estas

    franquicias present los siguientes rendimientos el primer ao de operacin

    6,1 9,2 11,5 8,6 12,1 3,9 8,4 10,1 9,4 8,9

    a. Asumiendo que los rendimientos poblacionales tienen distribucin normal, contrastar la

    afirmacin de la compaa.

    b. Halle el p de la prueba

    c. Qu tipo de error se comete?

    Solucin

  • 5

    Prueba de hiptesis bilateral

    1.

    ?10:0 H

    para la compaa que se dedica a la venta de franquicias por

    trmino medio, los delegados obtienen durante el primer ao un

    rendimiento del 10%

    10:1 H Para la compaa que se dedica a la venta de franquicias por trmino medio, los delegados no obtienen durante el primer ao un

    rendimiento del 10%

    2. 05.0 gl 0.975

    Como alfa =0.05 975.02

    1025.02

    9 2.262

    3. Regin crtica o regin de rechazo

    4. Estadstico de la prueba

    n = 10 100 xS

    ns

    xtc

    /

    0

    Decisin Como tC cae en la regin se rechaza Ho.

    5. Conclusin

    Al nivel de significancia del 5%...............................suficiente evidencia para afirmar que

    para la compaa que se dedica a la venta de franquicias por trmino medio, los delegados

    obtengan durante el primer ao un rendimiento del 10%

    b) Hallando el p de la prueba

    *212)(12)(12 9tPttPp c p rechazar Ho c. Qu tipo de error se comete?.............................................................................................. ...

    Ejemplo 4 Cuando funciona correctamente un proceso produce frascos de champ

    cuyo contenido pesa, en promedio 200 gramos. Una muestra aleatoria de nueve frascos de

    una remesa present los siguientes pesos (en gramos) para el contenido

    214 197 197 206 208 201 197 203 209

    Asumiendo que la distribucin de la poblacin es normal, contrastar al nivel del 5%, la

    hiptesis nula de que el proceso est funcionando correctamente.

    Solucin

    Ejemplo 5 Suponga que el peso (en kilogramos) de ciertos paneles publicitarios

    sigue una distribucin normal. Para realizar un control de calidad de los mismos, se

    tomaron al azar una muestra de 7 de ellos, encontrndose los siguientes resultados:

    RRRR

    RRRA

    RRRR

  • 6

    Paneles 1 2 3 4 5 6 7

    Peso(en kilos) 55,50 56,20 61,00 64,50 67,80 62,10 56,70

    a. Se desea probar si las evidencia muestral permiten suponer que el verdadero peso

    promedio de estos paneles es menos de 59 kilos. Sabiendo que los pesos siguen una

    distribucin normal y = 0,05 b. Halle el p de la prueba

    c. Qu tipo de error se comete?

    Solucin

    Caso 3 Varianza 2 desconocida y n30

    Desviacin estndar de la poblacin se estima mediante la desviacin estndar muestral

    s

    Procedimiento para realizar la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    01

    00

    :

    :

    H

    H

    Unilateral

    01

    00

    :

    :

    H

    H

    Bilateral

    01

    00

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los puntos crticos3. Regiones crticas

    4. Clculos.

    ns

    xzc

    /

    0

    1zzc 1zzc

    2/1

    2/1

    zz

    zz

    c

    c

    Ejemplo 6 Los inspectores de INDECOPI al investigar el cargo levantado contra una

    embotelladora de que no llena adecuadamente las botellas, tomaron una muestra de 100

    botellas y encontraron que el contenido tena una media de 31,65 onzas con una desviacin

    estndar de dos onzas. Las botellas indican en su etiqueta que contienen 32 onzas. Al nivel

    de significacin del 2%.

    a. Deberan los inspectores aceptar que las botellas estn siendo llenadas con menos contenido

    medio que el indicado?

    b. Halle el p de la prueba

    c. Qu tipo de error se comete?

    Solucin PRUEBA DE HIPTESIS UNILATERAL

    1. 32:0 H

    El contenido neto de las botellas es por lo menos a 32 onzas

    32:1 H ? El contenido neto de las botellas es menos a 32 onzas

  • 7

    2. 02.0 98.01

    3. Regin crtica o regin de rechazo

    4. Estadstico de la prueba

    n = 100 3265.312 0 xS

    75.1

    100

    2

    3265.31

    /

    0

    nS

    xzc

    Decisin Como ZC se rechaza Ho.

    5. Al nivel de significancia del 4% no hay suficiente evidencia para aceptar que la

    embotelladora no llena adecuadamente las botellas, es decir, los inspectores de INDECOPI

    no tenan razn

    b) Usando el p de la prueba

    02.00409.0)75.1()( zPzzPp c No se rechaza H0

    c. Qu tipo de error se comete?............................................................................................

    Ejemplo 7 Una cadena de restaurantes de comida rpida afirma en su anuncio

    publicitario: Te atendemos en menos de 3 minutos. Para corroborar esta afirmacin se le encarga a usted verificarla y para ello decide seleccionar al azar una muestra de 50 clientes

    de uno de estos restaurantes encontrando que el tiempo promedio de espera era de 2,75

    minutos con una desviacin estndar de 1 minuto.

    a. Ser cierta la afirmacin dada por esta cadena de restaurantes? Use un nivel de

    significancia del 5%.

    b. Halle el p de la prueba

    c. Qu tipo de error se comete?

    Solucin

    PRUEBAS DE HIPTESIS PARA UNA PROPORCIN POBLACIONAL

    Procedimiento para realizar la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    01

    00

    :

    :

    ppH

    ppH

    Unilateral

    01

    00

    :

    :

    ppH

    ppH

    Bilateral

    01

    00

    :

    :

    ppH

    ppH

    2. Fijar el nivel de significacin

    3. Regiones crticas

    4. Clculo del estadstico de la prueba

    RRRR

    RRRA

  • 8

    n

    qp

    ppzc

    00

    0

    1zzc 1zzc

    2/1

    2/1

    zz

    zz

    c

    c

    5. Conclusiones

    Ejemplo 8 El jefe de personal opina que el 18% de los empleados de la compaa

    trabajan horas extras cada semana. El porcentaje observado esta semana en una muestra de

    100 empleados es de 9%. Con un nivel de significacin del 5%. La opinin del jefe de

    personal ha cambiado?

    Solucin

    Ejemplo 9 En una encuesta a 400 electores de un distrito, el 52 % estaban de

    acuerdo con la gestin del alcalde. Con un nivel de significacin del 5%. Se puede afirmar

    que ms de la mitad de los electores del distrito estn de acuerdo con la gestin del alcalde?

    Solucin

    Ejemplo 10 En abril del 2010 un diario de la capital public en base a una encuesta

    realizada por una prestigiosa encuestadora a una muestra de 2735 limeos el siguiente

    grfico:

  • 9

    Es posible concluir en base a la informacin muestral que a lo ms el 60% de los limeos

    son trabajadores independientes? Use =0,03

    Solucin

    Ejemplo 11 Una organizacin de defensa del consumidor afirma que ms del 15% de

    los clientes de una compaa que presta servicios de desratizacin necesita que se repita el

    proceso despus del perodo de garanta de 90 das. Para determinar la validez de esta

    afirmacin, selecciona una muestra aleatoria de 100 clientes y descubre que 22 necesitaron

    repetir el proceso despus del perodo de garanta de 90 das. Usando un nivel de

    significacin del 5%, hay evidencia estadstica de que la afirmacin sea vlida?

    Solucin

    PRUEBA DE HIPTESIS PARA DOS VARIANZAS POBLACIONALES

    Al comparar las varianzas de dos poblaciones normales usaremos datos obtenidos de dos

    muestras aleatorias independientes, una de la poblacin 1 y la otra de la poblacin 2. Las

    dos varianzas de las muestras, y sern la base para realizar la inferencia acerca de las dos

    varianzas poblacionales 2

    2

    2

    1 y Las muestras son independientes y las poblaciones tienen distribucin normal

    Procedimiento para realizar la prueba de hiptesis

    1. Planteamiento de las hiptesis

    2

    2

    2

    11

    2

    2

    2

    10

    :

    :

    H

    H

    2. Fijar el nivel de significacin: alfa

    3. Regiones crticas. F1, F2 valores crticos

  • 10

    1;1,2

    2

    12

    1

    nnF

    F

    1;1,2

    121

    nn

    FF

    4. Estadstico de la prueba

    2

    2

    2

    1

    s

    sFc

    n1 : Es el tamao de la muestra de la poblacin 1.

    n2 : Es el tamao de la muestra de la poblacin 2. 2

    1 : Es la varianza de la muestra de la poblacin 1. 2

    2 : Es la varianza de la muestra de la poblacin 2. F: Es la distribucin F con n11 y n21 grados de libertad.

    5. Conclusin

    Ejemplo 12 .En un estudio de investigacin referente al nmero de accidentes de

    trnsito diario que ocurren en Lima segn distrito, realizado por el Diario El Comercio,

    destaca que tanto en el Cercado de Lima y en el Distrito de la Victoria en el ao 2008 son

    los distritos que presentan mayor incidencia de accidentes. Bajo el supuesto de

    normalidad de la variable en estudio. Con un nivel de significacin del 5%, existe

    evidencia para afirmar que la variabilidad del nmero accidentes de trnsito diario es

    diferente para ambos distritos?

    Cercado (1) 70 90 84 65 75 85 71

    La Victoria(2) 43 43 51 56 44 64 58

    Distrito n media Desviacin

    estndar

    Accidentes

    Cercado 7 77.14 9.263

    La Victoria 7 51.29 3.160

    Solucin

    Ejemplo 13. La empresa de investigacin de mercados ABC realiza un estudio para

    evaluar el tiempo que pasan conectados a Internet, por mes, adultos y jvenes de los

    niveles socioeconmicos A y B. En un estudio preliminar, se concluy que, en promedio,

    los adultos pasan ms tiempo conectados a Internet que los jvenes. Suponga que para

    confirmarlo esta empresa toma una muestra de 25 adultos y otra de 21 jvenes. Las

    desviaciones estndar de las cantidades de tiempo que pasan conectados a Internet son 94 y

    58 minutos, respectivamente. Estos resultados favorecen la conclusin que las varianzas

    de los tiempos que pasan conectados a Internet los adultos es diferente al de los

    jvenes? Use alfa= 0,05. Asuma distribucin normal.

    Solucin

  • 11

    Ejemplo 14 Una agencia de Informes de consumidores deseaba comparar el precio de

    una marca particular de una calculadora en dos ciudades diferentes: Se seleccion una

    muestra aleatoria de seis tiendas en una ciudad y de ocho tiendas en la segunda ciudad, con

    los siguientes resultados

    Usando un nivel de significacin del 5% se puede confirmar que existe una diferencia

    significativa en la variabilidad del precio de la calculadora en las dos ciudades?

    Solucin:

    PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS

    POBLACIONALES

    Caso 1 : Varianzas conocidas de la poblacin, las muestras son independientes y cada una

    de las poblaciones tiene distribucin normal o los tamaos de muestra son suficientemente

    grandes.

    Procedimiento para la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    211

    210

    :

    :

    H

    H

    Unilateral

    211

    210

    :

    :

    H

    H

    Bilateral

    211

    210

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los puntos crticos3. Regiones crticas

    4. Clculos: Estadstico de la prueba

    2

    2

    2

    1

    2

    1

    2121

    nn

    uuxxzc

    1zzc 1zzc

    2/1

    2/1

    zz

    zz

    c

    c

    5. Conclusiones

    Ciudad 1 10 12 9 14 12 10

    Ciudad 2 13 16 8 12 14 13 11 14

  • 12

    Ejemplo 15 Se llev a cabo un estudio para comparar el tiempo que toma a los

    hombres y mujeres efectuar determinada maniobra en una lnea de ensamble. Se utilizaron

    muestras independientes de 50 hombres y 50 mujeres en un experimento en el cual se

    tomaba a cada persona el tiempo para hacer tareas idnticas. Los resultados fueron los

    siguientes:

    Datos N 2 x Hombres1 50 18 42s

    Mujeres2 50 14 38s

    Presentaron estos datos la evidencia suficiente como para decir que hay una diferencia

    entre los verdaderos tiempos de terminacin para hombres y mujeres? A un nivel se

    significancia del 5%

    Solucin

    Para realizar las pruebas de hiptesis acerca de la diferencia entre las medias de dos

    poblaciones con varianzas poblacionales desconocidas y poblaciones independientes que

    siguen una distribucin normal, usaremos la distribucin t.

    Aqu las varianzas poblacionales, pueden ser similares o diferentes, para ello ser

    necesario realizar previamente la prueba de la razn de las varianzas poblacionales. Esto

    afectar al clculo del error tpico de la diferencia de medias muestrales y el grado de

    libertad del estadstico de prueba.

    Caso 2 y 3 Varianzas desconocidas pero iguales o diferentes, las muestras son

    independientes y las poblaciones tienen distribucin normal.

    Procedimiento para la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    211

    210

    :

    :

    H

    H

    Unilateral

    211

    210

    :

    :

    H

    H

    Bilateral

    211

    210

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los valores crticos3. Regiones crticas

    4. Clculos: estadstico de la prueba

    Si las varianzas poblacionales son similares

    221

    21

    2

    2121

    11

    nn

    p

    c t

    nnS

    uuxxt

    2

    11

    21

    2

    22

    2

    112

    nn

    snsnS p

    Si las varianzas poblacionales son diferentes

    vc t

    n

    s

    n

    s

    uuxxt

    2

    2

    2

    1

    2

    1

    2121

    2

    11 1

    2

    2

    2

    2

    1

    2

    1

    2

    1

    2

    2

    2

    2

    1

    2

    1

    n

    n

    s

    n

    n

    s

    n

    s

    n

    s

    v

    Rechazar Ho si

  • 13

    1,1 nc tt 1,1 nc tt

    1,2/1

    1,2/1

    nc

    nc

    tt

    tt

    5. Conclusiones.

    Ejemplo 16 Ciertos observadores de medios afirman que la cantidad promedio de

    minutos dedicados a las noticias de negocios y finanzas durante los noticieros de dos

    canales de televisin no son similares. Para cada canal, seleccionaron de manera aleatoria

    e independiente diez emisiones semanales y observaron durante la transmisin la cantidad

    de minutos dedicados a la noticia de negocios y finanzas. Los tiempos medidos en estas

    muestras independientes se presentan a continuacin. Asumiendo normalidad en las

    poblaciones y varianzas similares en el tiempo que dedican a las noticias de negocios y

    finanzas, es correcta la afirmacin de los observadores utilizando un nivel de significacin

    del 5%?

    Canal

    8 (1) 3,8 2,7 4,9 3,4 3,7 4,5 4,2 2,8 3,5 4,6

    Canal

    10 (2) 3,6 4,0 4,5 5,2 4,8 4,3 5,7 3,5 3,7 5,8

    Solucin

    Ejemplo 17. Usted desea determinar si un cambio en os procedimientos has

    disminuido el tiempo que su empresa se demora instalando el servicio de televisin

    por cable en el domicilio del cliente. Para ello, posee los siguientes registros de

    muestras aleatorias para el procedimiento viejo, tiene una muestra de 25 instalaciones

    con un promedio muestral de 149 minutos y desviacin de 21 minutos, para el nuevo,

    31 instalaciones con promedio muestral de 135 minutos y desviacin de 19 minutos.

    a. Se desea saber si las varianzas de los procedimientos son iguales. Existe evidencia de diferencia en las varianzas, con una probabilidad

    de incurrir en error tipo I del 1%?

    Solucin

    Se desea comparar las varianzas del procedimiento antiguo y del nuevo, a las cuales

    se llamar respectivamente X;Y.

    1ro PRUEBA DE HIPTESIS BILATERAL

    2

    2

    2

    11

    2

    2

    2

    10

    :

    :

    H

    H

    2. Fijar el nivel de significacin: alfa=0.01= Error tipo I

    3. Regiones crticas. F1, F2 valores crticos

    3484.087.2

    1

    1

    1

    24,30,005.0

    1;1,2

    2

    12

    F

    FF

    nn

    30,24,005.0

    1;1,2

    121

    F

    FFnn

    2.73

    n1 =25: tamao de la muestra de la poblacin 1. n2 =31: tamao de la muestra de la

    poblacin 2. 2

    1 : Es la varianza de la muestra de la poblacin 1. 2

    2 : Es la varianza de la muestra de la poblacin 2. F: Es la distribucin F con n11 =24y n21=30 grados de libertad.

  • 14

    4. Estadstico de la prueba

    2216.119

    212

    2

    2

    2

    2

    1 s

    sFc

    No Rechazo H0

    5. Al nivel de significancia del 1% No existe evidencia de diferencia en las varianzas.

    b. Existe evidencia de disminucin de los tiempos de instalacin, si usted desea correr

    un riesgo mximo del 0.5% es decir que existe una disminucin, cuando en realidad

    no la hay?

    Solucin

    1.

    211

    210

    :

    :

    H

    H

    2. Fijar el nivel de significacin: =0.5% = 0.005 para hallar los valores crticos3. Regiones crticas

    3. Clculo estadstico de la prueba

    4.

    6154.2

    31

    1

    25

    19137.19

    0135149

    11

    21

    2

    2121

    nnS

    uuxxt

    p

    c

    221

    2

    22

    2

    112 9137.192

    11

    nn

    snsnS p

    No rechazo H0

    5. No existe evidencia para rechazar la igualdad de las medias.

    c. Calcule la probabilidad de afirmar que no existe evidencia de disminucin de

    tiempos, cuando en realidad dicha disminucin es de 10 minutos

    Solucin

    La probabilidad aqu solicitada corresponde a la definicin de , la probabilidad de incurrir en el error tipo II.

    El valor sensible es una diferencia de 10 minutos.

    Dada la conclusin de la prueba, el error tipo II se hace muy relevante para los resultados

    de la misma. Es por eso que lo mejor es hallar lo desde el principio de la prueba

    En este caso, el valor que separa las reas de rechazo y no rechazo, una vez estudentizado

    es 2.6699 del cual se puede obtener el valor 21 xx al despejarlo de la definicin del estadstico de la prueba

    msxx

    nnS

    nnS

    uuxxt p

    p

    c

    2924.1400723.0)9137.19(6699.2

    0733.011

    9137.196699.211

    21

    21

    22

    21

    2

    2121

    De donde se debe calcular,

    %69.78802.00723.09137.19

    02924.14

    )2924.14(

    5454

    21

    tPtP

    xxP

    Como la probabilidad de cometer error tipo II e suficientemente grande como para

    revaluar el tamao de muestra de la prueba. Si se supone que la desviacin

    poblacional conjunta es de 20.6 (para ello se puede hacer una prueba de hiptesis) el

    tamao que se requerira por diseo para alfa=0.5% y beta=5%

    RRRR

    RRRA

  • 15

    Sera

    tiempos

    zzn

    yx

    152010

    645.1576.26.206.20

    2

    222

    2

    01

    2

    11

    22

    Este resultado implica 152 mediciones para el procedimiento antiguo, y 152 para el

    nuevo.

    En este caso el experimento deber repetirse.

    Ejercicio 18 Un vendedor de jugo de naranja natural compra paquetes de 100 naranjas

    de dos tipos y tiene la sospecha que la cantidad promedio de jugo extrado de la naranja

    tipo 1 es mayor al del tipo 2. Al seleccionar al azar 10 paquetes de cada tipo de naranja y

    anotar la cantidad de jugo extrado (en litros) obtuvo los siguientes resultados:

    Tipo 1 20,3 22,5 23,3 29,1 26,5 22,1 20,8 28,6 23,3 21,5

    Tipo 2 23,5 26,5 28,6 21,5 26,4 27,9 26,5 25,5 26,7 28,9

    Adems se sabe que el vendedor compra mensualmente paquetes del tipo 1 y 2. Utilice un

    nivel de significacin del 5% para corroborar su afirmacin.

    Solucin

    Ejemplo 19 El Gerente de Ventas de la compaa M&E desea analizar 2 tcnicas de

    ventas A y B, para ello seleccion al azar 2 muestras aleatorias independientes de 31 y 41

    vendedores que aplicaron las 2 tcnicas, obteniendo como resultado ventas promedio de 37

    y 35 mil soles y varianzas de 21 y 9 (mil soles)2 respectivamente. Al nivel de significacin

    del 5%.

    a. Se puede inferir que la variabilidad de las ventas para las 2 tcnicas son diferentes?

    b. Se puede inferir que el valor de las ventas promedio aplicando las tcnicas A y B no

    son similares?

    Solucin

  • 16

    Caso 4 Varianzas conocidas de la poblacin, las muestras son independientes y tiene

    tamaos de muestra suficientemente grandes.

    Procedimiento para la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    211

    210

    :

    :

    H

    H

    Unilateral

    211

    210

    :

    :

    H

    H

    Bilateral

    211

    210

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los puntos crticos3. Regiones crticas

    4. Clculos: Estadstico de la prueba

    2

    2

    2

    1

    2

    1

    2121

    n

    s

    n

    s

    uuxxzc

    1zzc 1zzc 2/12/1 zzzz cc

    5. Conclusiones

    Ejemplo 20 El centro de exmenes del Touring Automvil Club del Per sostiene que

    el puntaje promedio obtenido por los hombres al rendir el examen escrito para obtener la

    licencia de conducir es mayor al puntaje promedio de las damas al rendir el mismo examen.

    Para probar esta hiptesis la institucin tom dos muestras de postulantes que rindieron el

    examen la ltima semana, obtenindose los siguientes resultados:

    Hombres Mujeres

    Tamao de muestra 41 46

    Promedio 25,45 17,68

    Desviacin estndar 1,3 1,2

    Si se muestrearon dos poblaciones independientes se puede afirmar con un nivel de

    significacin del 5% que es cierto lo manifestado por el centro de exmenes de esta

    institucin?

    Solucin

  • 17

    PRUEBA DE HIPTESIS PARA DOS MEDIAS POBLACIONALES PAREADAS:

    MUESTRAS DEPENDIENTES

    La prueba estadstica t de Student para muestras dependientes es una extensin de la

    utilizada para muestras independientes. De esta manera, los requisitos que deben

    satisfacerse son los mismos, excepto la independencia de las muestras; es decir, en esta

    prueba estadstica se exige dependencia entre ambas, en las que hay dos momentos uno

    antes y otro despus. Con ello se da a entender que en el primer perodo, las observaciones

    servirn de control o testigo, para conocer los cambios que se susciten despus de aplicar

    una variable experimental.

    En el diseo con muestras pareadas o dependientes se someten a prueba dos medias

    poblacionales bajo condiciones similares; por consiguiente, este diseo conduce con

    frecuencia a un menor error muestral que el diseo con muestras independientes.

    Procedimiento para la prueba de hiptesis

    1. Planteamiento de las hiptesis

    Unilateral

    211

    210

    :

    :

    H

    H

    Unilateral

    211

    210

    :

    :

    H

    H

    Bilateral

    211

    210

    :

    :

    H

    H

    2. Fijar el nivel de significacin: para hallar los puntos crticos3. Regiones crticas

    4. Clculos: Estadstico de la prueba

    n

    s

    udt

    d

    d

    c

    d:es la diferencia delapar de datos; de estos datos se obtiene la media y la desviacin

    1,1 nc tt 1,1 nc tt

    1,2/1

    1,2/1

    nc

    nc

    tt

    tt

    5. Conclusiones

    Ejemplo 21 La publicidad del gimnasio Gym Center asegura que al trmino del curso

    de 6 meses que ofrece se obtendr una efectiva prdida de peso corporal. Una muestra

    aleatoria de 8 registros seleccionados al azar de este gimnasio permiti observar el peso

    corporal (en Kilos) entre los meses de febrero a julio de 8 participantes que asistieron al

    curso. Los resultados se muestran a continuacin:

    Participante 1 2 3 4 5 6 7 8

    Febrero

    2011

    70 103 63 73 95 74 83 77

    Julio 2011 69 93 66 71 88 68 77 74

    a. Si los pesos corporales se distribuyen normalmente y con un nivel de significancia del

    5%, se puede afirmar que lo ofrecido por este gimnasio es cierto?

    b. Halle el intervalo de confianza

    Solucin

  • 18

    Ejemplo 22 Doce individuos participaron en un experimento para estudiar la

    efectividad de cierta campaa publicitaria, registrndose la informacin de sus consumos

    realizados (en soles) antes y despus de observar por televisin la publicidad de dicho

    producto. Los datos que se presentan a continuacin:

    Sujetos 1 2 3 4 5 6 7 8 9 10 11 12

    Antes (1) 201 231 221 260 228 237 326 235 240 267 284 201

    Despus (2) 200 236 216 233 224 216 296 195 207 247 210 209

    a. Con un nivel de significacin del 5% se puede concluir que la campaa publicitaria es

    efectiva para aumentar los niveles de consumo de dicho producto? Asuma normalidad.

    b. Halle el intervalo de confianza

    Solucin

    PRUEBA DE HIPTESIS PARA DOS PROPORCIONES POBLACIONALES

    En las pruebas de hiptesis en las que el valor hipottico de (p1 p2) es cero, el cero indica que no hay diferencia entre las dos proporciones poblacionales, p1 y p2.

    En este caso se deben combinar las dos proporciones muestrales para obtener un estimado

    de la proporcin poblacional. Si el valor hipottico de (p1 p2) es diferente de cero, entonces utilizaremos las proporciones muestrales para estimar el error tpico de la

    diferencia de proporciones muestrales.

    1. Planteamiento de las hiptesis

    Unilateral

    211

    210

    :

    :

    ppH

    ppH

    Unilateral

    211

    210

    :

    :

    ppH

    ppH

    Bilateral

    211

    210

    :

    :

    ppH

    ppH

    2. Fijar el nivel de significacin y hallar los valores crticos

    3. Regiones crticas

    4. Clculo del estadstico de la prueba

    21

    21

    21

    2211

    21

    2121

    11)1(

    nn

    xx

    nn

    pnpnp

    nnpp

    pppp

    zc

    2

    2

    1

    1

    2#1#

    n

    muestralaenxitosdep

    n

    muestralaenxitosdep

    1zzc 1zzc

    2/1

    2/1

    zz

    zz

    c

    c

    5. Conclusiones

    Ejemplo 23 En una encuesta realizada el ao pasado se determin que 20% de 505

    hombres y 25% de 426 mujeres encuestados, estaban a favor de prohibir la venta libre de

    cerveza, vinos y licores en el pas. Con un nivel de significacin del 5%, considera usted

    que las mujeres favorecen ms a la prohibicin?

    Solucin

  • 19

    Ejemplo 24 La asociacin de ex alumnos de la Facultad de Ingenieras y arquitectura

    ha seleccionado una muestra aleatoria de 100 graduados en el 2 010. En la muestra, 36

    fueron de ingeniera de Sistemas e ingeniera Industrial y 64 de las otras especialidades.

    Los resultados de cada muestra indican que 15 egresados de cada especialidad ganan por lo

    menos 3 000 $ mensuales . Al nivel de significacin del 5% Existe diferencia entre la

    proporcin de graduados de ingeniera de Sistemas e ingeniera Industrial y los egresados

    de otras materias que ganan cuando menos 3 000 dlares mensuales?

    Solucin

    Ejemplo 25 Se tiene la siguiente informacin muestral resultante de una encuesta

    realizada a alumnos de dos universidades:

    Correo electrnico preferido

    Hotmail Gmail Yahoo

    Universidad A 85 75 95

    Universidad B 107 98 65

    Es posible afirmar que la proporcin de alumnos de la universidad A que no prefieren el

    correo electrnico Gmail es mayor a la proporcin de alumnos de la universidad B? Utilice

    un nivel de significancia del 1%.

    Solucin