Pruebas de Hipótesis · se toma una muestra de 19 observaciones y se ... solo 10 de ellos indican...
Transcript of Pruebas de Hipótesis · se toma una muestra de 19 observaciones y se ... solo 10 de ellos indican...
Pruebas de Hipótesis
Una prueba de hipótesis es una técnica
de Inferencia Estadística que permite
comprobar si la información que
proporciona una muestra observada
concuerda (o no) con la hipótesis
estadística formulada y, por lo tanto,
decidir si se debe aceptar o rechazar
dicha hipótesis.
Introducción • Ejemplos:
un investigador que pretende demostrar que la droga A es más efectiva para el tratamiento de cierta enfermedad que la droga B;
cuando un psicólogo desea comprobar si cierto formato de instrucción incrementará la eficiencia en el aprendizajes;
cuando un ingeniero agrónomo desea comprobar si una nueva distancia de siembra entre surcos, para un cultivo, produce mejores rendimientos que las distancias que se usaban comúnmente en la zona;
cuando el jefe de marketing asegura que determinado producto es aceptado por el 60% de la población consumidora, etc.
• En cada uno de los casos anteriores el responsable del estudio postula o conjetura algo acerca de un sistema.
• Se puede decir que se llaman decisiones estadísticas a las decisiones que deben tomarse con respecto a las poblaciones a partir de una información obtenida de una muestra de las mismas.
Hipótesis Estadística es cualquier afirmación o conjetura sobre una
o varias características de interés de la
población.
Paramétrica
No Paramétrica
:
Es una afirmación sobre
alguna característica
estadística de la población
en estudio.
Por ejemplo, las
observaciones son
independientes, la
distribución de la variable en
estudio es normal, la
distribución es simétrica, etc.
Es una afirmación sobre los valores de
los parámetros poblacionales
desconocidos.
Simple
la hipótesis
asigna valores
únicos a los
parámetros
Compuesta
la hipótesis
asigna un rango
de valores a los
parámetros
Identificación de las Hipótesis
Estadísticas Paramétricas
Hipótesis nula Ho
– Se plantea con el parámetro de interés usando alguno de los
símbolos
– La probabilidad de rechazar Ho es muy baja,
y se llama nivel de significación
porque Ho es la hipótesis que se considera cierta.
Hipótesis Alternativa H1
– Es contraria a la hipótesis nula. (Niega a H0). Se plantea usando
según el caso respectivo al planteo de Ho.
– Está muy relacionada con la hipótesis de investigación,
es coherente con los resultados obtenidos en la
muestra
La probabilidad de aceptación de H1 es
:H
:H
1
0
, ,
, >,<
Ejemplo 20 20
Observaciones
• El propósito de cualquier prueba de hipótesis es decidir cual hipótesis sería rechazada o cuál ha sido aceptada.
• Cualquier decisión estará basada sobre información parcial de una población, contenida en una muestra, por lo que habrá siempre una posibilidad de una decisión incorrecta.
• La siguiente tabla resume cuatro posibles situaciones que pueden surgir en un test de hipótesis.
Verdadero estado de la población
Decisión posible H0 es cierta H1 es cierta
Se rechazo H0 Error de tipo I Decisión correcta
No se rechaza H0
Decisión correcta Error de tipo II
Esquema para realizar una prueba
de hipótesis
Etapas:
1) Enunciado de la hipótesis nula y alternativa
2) Selección del estadístico de prueba (Considerar el parámetro poblacional utilizado en 1) y los datos del problema).
3)Gráfico de la distribución del estadístico de prueba para la determinación de la región crítica con el alfa dado y la búsqueda en tabla del valor crítico.
4) Cálculo del valor observado a partir del estadístico.
5) Comparación de valores.
6) Exposición de las conclusiones
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: <20 H1: >20
H1: 20
20
20 20
Prueba para la media poblacional con
varianza poblacional conocida.
• Con frecuencia deseamos saber si
ha cambiado o no una media
poblacional. O podemos
interesarnos por determinar si una
media de una población es diferente
o no de un cierto valor supuesto.
Ejemplo Un establecimiento tambero tiene una producción
media diaria de 25,8 (lt en miles). El gerente del establecimiento pretende modificar ciertas maquinarias con el objetivo de aumentar la
producción. Se sabe que la dispersión general es de 0,3 (lt en miles) y no se espera que ese valor cambie
con las modificaciones. Se desea probar, con un nivel de significación del 1 %, que la producción
promedio no está afectada por el cambio. Para esto, se toma una muestra de 19 observaciones y se encuentra que la nueva media es de 26,1 (lt en
miles).¿El cambio afectó la producción media diaria ?
Prueba para la media poblacional
con varianza poblacional
desconocida
Ejemplo: Un auditor desea probar el supuesto de que el valor
medio de la totalidad de las cuentas por cobrar de
una empresa dada es de $260.000.
Toma una muestra n = 16 cuentas por cobrar y
obtiene una media muestral de $240.000, con una
dispersión de $43.000. Suponga un nivel de
significación del 5% para concluir si los datos
muestrales dan evidencia suficiente para contradecir
el supuesto del auditor.
Prueba de hipótesis sobre una
proporción
• En muchos problemas de Ingeniería
se debe tomar una decisión con
respecto a una proporción.
• Los supuestos para poder aplicar
este test son los mismos que se
necesitan para construir un intervalo
de confianza para una proporción
Ejemplo:
El director de la agencia de colocaciones de una universidad sostuvo que al menos
50% de los estudiantes a punto de graduarse habían cerrado un trato de empleo para el 1º
de Marzo. Supongamos que se reúne una muestra aleatoria de estudiantes (n=30) y
solo 10 de ellos indican haber cerrado trato de empleo. ¿Puede rechazarse el argumento
del director de la agencia al nivel de significación del 5%?
Prueba de hipótesis para
una varianza
En este problema debemos probar si la varianza poblacional es un valor
determinado.
Usamos los mismos supuestos que los utilizados para la realización del
intervalo de confianza para la varianza y el mismo estadístico de
prueba.
Ejemplo
Suponga que un fabricante esta produciendo pernos de 8 mm de diámetro, y que los diámetros de estas
piezas se distribuyen normalmente ; con propósitos de control de calidad, se obtuvo una muestra de 25 pernos de una línea de producción para estimar la varianza de todos los diámetros , la cual resultó ser
de 0.009 mm2. Con un nivel de significación de 0.05. ¿Se puede concluir que la varianza poblacional
es menor que 0.01 mm2?
Prueba de hipótesis acerca de dos
parámetros
• Otro problema que se presenta
frecuentemente en el trabajo experimental
es determinar si dos distribuciones de
probabilidad tienen algunos parámetros
que son los mismos, sin especificar los
valores comunes de esos parámetros.
• Tenemos pruebas para la igualdad de dos
medias y para la igualdad de dos
varianzas
Prueba para la comparación de
Medias (varianzas poblacionales
conocidas)
• Ejemplo: Se hace un test de eficiencia a 50 ingenieros industriales y 60 ingenieros civiles, obteniéndose los siguientes resultados:
a) Verificar con un nivel de significación del 5% si la diferencia se puede atribuir a la casualidad o no.
b) Ïdem a) pero suponiendo varianzas poblacionales desconocidas e iguales, sabiendo que se obtuvo una
dispersión muestral de 6 y 5,5 respectivamente.
5 87
7 89
22
11
X
X
Prueba de hipótesis para comparar
medias con varianzas poblacionales
desconocidas
Se espera que dos operadores produzcan, en promedio, el mismo
número de unidades terminadas en el mismo tiempo . Los datos son los
números de unidades terminadas para ambos en una semana de
trabajo:
Operador 1 Operador 2
12 14
11 18
18 18
16 17
13 16
Si se supone que el número de unidades terminadas diariamente por los
dos trabajadores son variables aleatorias independientes distribuidas
normalmente. ¿Se puede establecer diferencia entre las medias a un
nivel de significación del 0,1 ?
La comparación de medias para
muestras independientes requiere
igualdad de varianzas poblacionales
Debe hacerse un pre-test para comparar varianzas.
2 2
0 1 2
2 2
1 1 2
:
:
H
H
1) Plantear las hipótesis 2) Establecer el estadístico de prueba.
2
1
2
2
ob
SF
S
3) Definir el nivel de significación y la zona de rechazo de Ho, en el gráfico de la distribución del estadístico. Hallar los valores críticos. Si
1 2
2 1
1, 1,12
1, 1,2
1
n n
n n
FF
1 2
1 2
4,4;0,011, 1;
2
1, 1,14,4;0,012
15,977
1 10,0625
15,977
n n
n n
F F
FF
No siempre es el inverso
0,02
Continuación
4) Calcular el valor observado a partir del estadístico de prueba.
2
2
2,915 8,4973,03
1,673 2,7989obF
5) Comparar el valor observado con el valor crítico.
6) Conclusiones: Luego las varianzas son iguales.
0 3,03 0,0625;15,977bF
Pertenece a la zona de aceptación de Ho.
Comparación de medias para
muestras independientes
0 1 2 1 2
1 1 2 1 2
: 0
: 0
H ó
H ó
Se plantea una prueba para medias, para varianzas
desconocidas pero iguales, de los datos se obtiene
1 214 16,6x x
1) Plantear las hipótesis
2) Establecer el estadístico de prueba.
1 2 1 2
2 2
1 1 2 2
1 2 1 2
1 1 1 1
2
ob
x xt
n S n S
n n n n
Continuación
3) Definir el nivel de significación y la zona de rechazo de Ho, en el gráfico de la distribución del estadístico.
4) Calcular el valor observado a partir del estadístico de prueba.
1 2
8;0,012;
2
1.3968n n
t t
5) Comparar el valor observado con el valor crítico.
2 2
14 16,6 0 2,60,728
3,5724.2,915 4.1,673 1 1
5 5 2 5 5
obt
1,396;1,396obt Se acepta Ho
Conclusiones
Al aceptar Ho, la diferencia de medias muestrales no es significativa, se debe al
azar.
Luego las medias poblacionales son iguales, lo que se traduce en que los dos
operadores producen, en promedio, el mismo número de unidades terminadas en
el mismo tiempo