03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze
-
Upload
luissalvador1987 -
Category
Documents
-
view
14 -
download
1
description
Transcript of 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ensayos de Hipótesis
Medir Controlar Mejorar Analizar Definir Reconocer
Six Sigma Entrenamiento Green Belt
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Acerca de este módulo …
Six Sigma, una Búsqueda de la Perfección en los Procesos Alcanzar las Metas y Combatir la Variación
Los ensayos de hipótesis ayudan para :
Determinar si existe una diferencia real entre dos muestras relativamente pequeñas (valor p < 0.05* )
Estimar la probabilidad (valor p > 0.05*) de tener una muestra no representativa
Minimizar los riesgos asociados Alfa * y Beta
|Data File|hypothe.mtw
|Data File|hypothe2.mtw
|Data File|hypothe3.mtw
|Data File|hypothe4.mtw
\DataFile\StatTables.xls
\DataFile\SampleSize.xls
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Qué aprenderemos ...
1. Pasos de los ensayos de hipótesis
2. Riesgos Alfa (a) y Beta (b)
3. Cálculo de tamaño de muestra
4. Usar la prueba-t para comparar dos muestras
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Diseño:
Determinar si dos alternativas de cambio de diseño
presentan diferencias significativas.
Fabricación:
Determinar si dos materiales diferentes de suela de
zapatos se gastan igual.
Administración / Transacciones / Servicios:
Determinar la probabilidad que una muestra de un
proceso existente sea no representativa
Ejemplos del Mundo Real
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
1. Definir el problema
2. Determinar los objetivos
3. Establecer las Hipótesis
• Hipótesis Nula (H0)
• Hipótesis Alternativa (Ha)
4. Decidir la prueba estadística más apropiada
(asumir distribución Z, t, F)
5. Establecer el nivel alfa (usualmente 5 %)
6. Establecer el nivel beta (usualmente 10-20
%)
7. Establecer el efecto de la diferencia (delta)
8. Determinar el tamaño de la muestra
9. Desarrollar el plan de muestreo
Pasos en un Ensayo de Hipótesis
10. Seleccionar muestras
11. Desarrollar el ensayo y recolectar
datos
12. Calcular el estadístico (Z, t, o F) a
partir de los datos
13. Determinar la probabilidad que el
valor del estadístico sea resultado del
azar
14. Si esa probabilidad es menor que
alfa, rechazar H0
15. Si esa probabilidad es mayor que
alfa, no rechazar H0
16. Traduzca las conclusiones
estadísticas a soluciones prácticas
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Defina el Problema y los Objetivos
• Se debe presentar el problema clara y objetivamente:
– No presuponga soluciones
– Sea breve
– Sea específico
• Las metas, objetivos y beneficios de negocio deben ser mensurables y cuantificables.
La definición del problema y los objetivos de un ensayo estadístico es extremadamente importante!
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ejemplo Viejo
Diseño
Nuevo
Diseño
89.7 84.7
81.4 86.1
84.8 91.9
87.3 86.3
79.7 79.3
85.1 86.2
81.7 89.1
83.7 83.7
84.5 88.5
La solución requiere revisar los fundamentos de ensayo de hipótesis!
La velocidad de transferencia de
un disco rígido es marginal. Se
propone un nuevo diseño.
Se incorpora un Reporte de
Cambio de Ingeniería (ECN)
Es mejor el nuevo diseño?
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Los ensayos se usan para evaluar las
evidencias proporcionadas por los datos de
muestra, con el fin de poder decidir sobre un
parámetro de la población
La hipótesis nula (Ho) es la propuesta que
evaluamos.
Ho se suele presentar como: “no hay
diferencia”.
La hipótesis alternativa (Ha) se presenta
como “hay diferencia”.
No podemos rechazar Ho a menos que se
tenga una evidencia convincente para ello.
Ho
Ha
Ho
Ha
Ho p p
Ha p p
a b
a b
a b
a b
a b
a b
:
:
:
:
:
:
m m
m m
s s
s s
=
=
=
Ejemplos típicos
Establecer las Hipótesis
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Decidir el Ensayo Estadístico Apropiado
Normal o No-normal
1 Muestra, 2 Muestras o más
Datos tipo Variable o Atributo
El parámetro estadístico a ser ensayado (m, s, median)
El Ensayo Estadístico elegido depende de nuestro objetivo y
la calidad de datos existentes :
El Árbol de Decisión del Ensayo de Hipótesis ayuda en decidir que
tipo de ensayo realizar!
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Árbol de decisión de los Ensayos de Hipótesis
Ho: M1=M2=M3…
Ha: Al menos 2 son differentes
Minitab: Stat-Nonparametric-Mann-Whitney (or)
Stat-Nonparametric-Kruskal-Wallis (or)
Stat-Nonparametric-Freidmans
M1=Median sample 1, etc.
Ho: M1 = objetivo Ha: M1 objetivo
Minitab: Stat-Nonparametric-1 Sample - sign (or)
Stat-Nonparametric-1 Sample Wilcoxon
(Usado también con datos emparejados Ho: M1-M2=0)
M1=Median or sample 1
M target = Target Median
Ensayos de
Hipótesis
Datos Continuos
(Un solo factor)
Datos de
Atributos
Tabla de Contingencia
Prueba de Proporciones (Solo 2 factores)
Ho: 2 factores son independientes
Ha: 2 factores son dependientes
Minitab: Stat-tables-Chi square test
Ho: P1=P2 Ha: P1 P2
Minitab: Stat-Basic Stat-1or 2 proportions
Test de Normalidad
Ho:s1=s2=s3…
Ha: Al menos 1 es diferente
Minitab: Stat-ANOVA-Test for Equal Variances
Para sólo 2 s, esto es similar a un F-test: F=(S1)2/(S2)2
Si Fcalc>Fcrit, rechazar Hipótesis nula
(Usar Chi-Squared para 1 muestra)
Normal
2 ó más muestras
Test de Levene
2 ó más muestras
1 Muestra
Ho: Datos Normales
Ha: Datos NO Normales
Minitab: Stat-Basic Stat-Normality Test
Usar Anderson-Darling
Chi-Cuadrado Test de Bartlett
No-normal
1 Muestra 2 ó más Muestras
1 Sample T Test
Paired T Test (Variance =)
One Way ANOVA
2 Sample T Test
Ho: s1=sobjetivo Ha: s1 s objetivo
Minitab: Stat-Basic Stat-Display Desc Stat-
Graphical Summary
Si sobjetivo cae dentro de CI: no rechazamos Ho
Ho: m1=mobjetivo Ha: m1 mobjetivo
Minitab: Stat-Basic Stat-1 Sample-T
(Usado también con datos apareados :Ho: m1=m2=0)
Ho:s1=s2=s3… Ha: s1 al menos 2 son diferentes
Minitab: Stat-ANOVA-Test for Equal Variances
Para solo 2 ss, es igual que F-test:
Stat>BasicStat>2 Variances
F=(S1)2/(S2)2
Si Fcalc>Fcrit, rechaza Ho
Ho: m1=m2=m3=…
Ha: m1 al menos 2 son diferentes
Minitab: Stat-ANOVA-One Way
(Cuidado: Bartlett’s p<0.005;
asume=varianzas)
Ho: m1=m2 Ha: m1 m2
Minitab: Stat-Basic Stat-2 Sample-T
(Compara medias usando Std Dev global)
Seleccionar varianzas iguales o
Seleccionar varianzas diferentes
2 Muestras
Ho: m1-m2=0 Ha: m1-m2 0
Minitab: Stat-Basic Stat-Paired T
(Compara medias cuando las
observaciones están apareadas)
1 Sample Z Test
Ho: m1=mobjetivo Ha: m1 mobjetivo
Minitab: Stat-Basic Stat-1 Sample-Z
(Usado también con datos apareados: Ho:m1=m2=0)
Tamaño de muestra >=30 s conocida
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tipos de Ensayos de Hipótesis: Una Muestra
1 Prueba Z para 1 muestra Se usa para calcular el intervalo de confianza o realizar un
ensayo de hipótesis de la media, cuando s es conocida
Para una prueba a dos colas y una muestra Z
Tamaño de muestra (n) mayor o igual a 30
Prueba t para 1 muestra Se usa para calcular el intervalo de confianza o realizar un
ensayo de hipótesis de la media
s es desconocida
Para una prueba a dos colas y una muestra t
Tamaño de muestra (n) menor que 30
1
La filmina en inglés hablaba de s conocida, pero entiendo que corresponde σ conocida
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tipos de Ensayos de Hipótesis: 2 Muestras
Prueba t para 2 muestras Se usa para comparar dos muestras y determinar si existen diferencias
en las medias
Para una prueba a dos colas y dos muestras t
s es desconocida
Prueba t para datos apareados Se usa para calcular el intervalo de confianza y realizar el ensayo de
hipótesis de la diferencia entre las medias de población cuando las
observaciones están apareadas.
Este procedimiento se ajusta a aquellas respuestas en que existe
dependencia o relación entre pares de valores.
Esta dependencia hace que la variación entre los pares resulta en
errores de menor magnitud, con el consiguiente aumento en la
sensibilidad del ensayo o el intervalo de confianza.
2
2
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Típicamente, se fija este
riesgo en un 5%.
Riesgos Alfa y Beta; Errores Tipo I y II
Los errores tipo I se cometen
cuando rechazamos la
hipótesis nula y ésta es cierta
Los errores tipo II se cometen
cuando no rechazamos la
hipótesis nula y ésta es falsa.
El riesgo (a) es la probabilidad
de cometer un error tipo I.
Los riesgos se fijan “a priori”, antes de realizar el experimento.
Típicamente, se fija este
riesgo en un 10%.
El riesgo (b) es la probabilidad
de cometer un error tipo II.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ho no rechazada Ho rechazada
Ho no debería
rechazarse
(Ho es cierta)
Decisión
correcta
Error Tipo II, o
Riesgo del
Consumidor
b = P (Tipo II)
Ho debería
rechazarse
(Ho es falsa)
Error Tipo I, o
Riesgo del
Productor
a = P (Tipo I)
Decisión
correcta
a es el riesgo de encontrar una diferencia cuando realmente no existe.
b es el riesgo de no encontrar una diferencia cuando sí existe.
Acción
La “Verdad”
La Tabla Verdad de los Riesgos
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Recuerde:
a es el riesgo de encontrar una diferencia cuando realmente no existe.
b es el riesgo de no encontrar una diferencia cuando sí existe.
b a
Ho Ha
Ahora podemos determinar si el ECN mejoró el desempeño.
Otra forma de ver los Riesgos
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Las Poblaciones tienen
parámetros :
Media - m
Desviación Estándar - s
Cantidad de ítems - N
Las Muestras tiene
estadísticos:
Promedio - X
Desvío Estándar - s
Tamaño de muestra - n
Típicamente sacamos conclusiones de una población basándonos en las muestras
Por lo tanto, siempre hay un grado de incertidumbre en estas conclusiones.
La determinación de la “Potencia” nos permite cuantificar esa incertidumbre.
Recuerde de Estadística Básica
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Establecer el efecto del tamaño
Siempre existe una “solución de compromiso” entre:
1. La confianza que podemos tener de nuestra conclusión
2. Grado de diferencia del sigma requerido para ser detectado (relativo a la distribución de las poblaciones)
3. Tamaño de muestra
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Un Ratio bajo entre la diferencia entre las medias y la desviación
estándar implica que:
Se necesita un tamaño de muestra considerable para detectar si
existe una diferencia entre las medias de la población, ya que…
La probabilidad de extraer un gran número de individuos de las
áreas no solapadas es relativamente baja.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Unidades de Medición
Ilustración 1
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ilustración 2 Un Ratio alto entre la diferencia entre las medias y la desviación
estándar implica que:
Se necesita una muestra relativamente pequeña para determinar
que existe una diferencia entre las poblaciones ya que…
La probabilidad de extraer un gran número de individuos de las
áreas no solapadas es relativamente alta
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Unidades de Medición
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Unidades de Medición
Si el valor de la diferencia entre las medias a detectar es grande
relativo al valor de la desviación estándar de las poblaciones, es
más fácil detectar las diferencias, porque la probabilidad de extraer
individuos de las áreas no solapadas es relativamente grande.
Ilustración 3
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
2
2
/ 2 22 ( )n Z Za b
s
=
Tabla de selección de tamaño de muestra para t-test de 2 muestras
\DataFile\SampleSize.xls (2-tailed test) 20% 20% 20% 20% 10% 10% 10% 10% 5% 5% 5% 5% 1% 1% 1% 1% a
/s 20% 10% 5% 1% 20% 10% 5% 1% 20% 10% 5% 1% 20% 10% 5% 1% b
0.1 902 1314 1713 2603 1237 1713 2164 3154 1570 2101 2599 3674 2336 2976 3563 4806
0.2 225 328 428 651 309 428 541 789 392 525 650 919 584 744 891 1202
0.3 100 146 190 289 137 190 240 350 174 233 289 408 260 331 396 534
0.4 56 82 107 163 77 107 135 197 98 131 162 230 146 186 223 300
0.5 36 53 69 104 49 69 87 126 63 84 104 147 93 119 143 192
0.6 25 36 48 72 34 48 60 88 44 58 72 102 65 83 99 134
0.7 18 27 35 53 25 35 44 64 32 43 53 75 48 61 73 98
0.8 14 21 27 41 19 27 34 49 25 33 41 57 36 46 56 75
0.9 11 16 21 32 15 21 27 39 19 26 32 45 29 37 44 59
1 9 13 17 26 12 17 22 32 16 21 26 37 23 30 36 48
1.1 7 11 14 22 10 14 18 26 13 17 21 30 19 25 29 40
1.2 6 9 12 18 9 12 15 22 11 15 18 26 16 21 25 33
1.3 5 8 10 15 7 10 13 19 9 12 15 22 14 18 21 28
1.4 5 7 9 13 6 9 11 16 8 11 13 19 12 15 18 25
1.5 4 6 8 12 5 8 10 14 7 9 12 16 10 13 16 21
1.6 4 5 7 10 5 7 8 12 6 8 10 14 9 12 14 19
1.7 3 5 6 9 4 6 7 11 5 7 9 13 8 10 12 17
1.8 3 4 5 8 4 5 7 10 5 6 8 11 7 9 11 15
1.9 2 4 5 7 3 5 6 9 4 6 7 10 6 8 10 13
2 2 3 4 7 3 4 5 8 4 5 6 9 6 7 9 12
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
\DataFile\SampleSize.xls
Relación de Delta/Sigma respecto del Tamaño de Muestra
a = .05 b = .1
1
10
100
1000
10000
0.1
0.4
0.7 1
1.3
1.6
1.9
2.2
2.5
2.8
3.1
3.4
3.7 4
Delta/Sigma
Sa
mp
le s
ize
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Pasos en la selección de Tamaño de Muestra
1. Seleccionar riesgo a
2. Seleccionar riesgo b
– Nota: Potencia = 1- b
3. Seleccionar (delta, la diferencia que se quiere detectar)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tamaño de Muestra para el ejemplo de ingeniería
1. Sea riesgo a = 5% (95% Confianza)
2. Sea riesgo b = 10%
– Nota: potencia = 1- b = 90%
3. Ingeniería determinó que el delta () (la diferencia a detectar)
debe ser 1.5 sigma ( / s =1.5)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Cálculo de tamaño de muestra
De la tabla SampleSize.xls , Tab: 2 Sample t Table… a = 5%
b =1 0%
…El tamaño de muestra necesita ser mayor o igual a 9, que es lo que ingeniería proveyó!
Old Design New Design
89.7 84.7
81.4 86.1
84.8 91.9
87.3 86.3
79.7 79.3
85.1 86.2
81.7 89.1
83.7 83.7
84.5 88.5
/s = 1.5
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
a b D o n
Constant Constant
Constant Constant
Constant Constant
Constant Constant
Constant Constant
Constant Constant
Resumen de relaciones
2
2
/ 2 22 ( )n Z Za b
s
=
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tamaño de muestra usando Minitab : Ejemplo 1
Desarrollo: • Abra Minitab • Vaya a Stat > Basic Stat >
Power and Sample Size > 2-sample t
• El cuadro de diálogo Power and Sample Size for 2-Sample t aparecerá como se muestra
Un Green Belt debe llevar a cabo un t-test de dos muestras.
Quiere detectar un efecto estandarizado, /s, de 1.5.
El Green Belt decide un riesgo alfa de 5%. Alfa es el riesgo de
decir que existe un efecto cuando en realidad no existe..
El Green Belt decide un riesgo beta de 20%.
Beta es el riesgo de decir que no existe un efecto cuando en
realidad existe.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tamaño de muestra usando Minitab : Ejemplo 1 (Continuación)
1. Sigma es 1.0 porque estamos
usando un efecto estandarizado
2. Tipee el efecto estandarizado de
1,5 en Differences:
3. Tipee 0.80 en Power values: y
agregue 0.90, 0.95, 0.99 para ver
los tamaños de muestra requeridos
por una mayor potencia
4. Seleccione OK
5. Nota: podemos especificar
cualesquiera de dos valores y
obtener el tercero
1
5
4
3
Potencia es la probabilidad
de detectar el efecto, si
existe
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tamaño de muestra usando Minitab : Ejemplo 1 (Continuación)
La Ventana de Sesión Minitab muestra los resultados del análisis
estadístico :
La solución Minitab difiere de la Tabla porque Minitab usa la distribución t y la tabla usa la distribución normal, como aproximación.
Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Assumed standard deviation = 1 Sample Target Difference Size Power Actual Power 1.5 9 0.80 0.847610 1.5 11 0.90 0.916899 1.5 13 0.95 0.956112 1.5 18 0.99 0.992017
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Llevando a cabo un t-test usando Minitab:
Ejemplo 2 • El Green Belt quiere determinar si un nuevo diseño es
diferente respecto a un viejo diseño por más de un efecto estandarizado de 1.5. El riesgo alfa es 5%.
• El Green Belt extrae 9 muestras del viejo diseño y 9 muestras del nuevo diseño.
• Hipótesis:
0
OldDesign NewDesign
89.7 84.7
81.4 86.1
84.8 91.9
87.3 86.3
79.7 79.3
85.1 86.2
81.7 89.1
83.7 83.7
84.5 88.5
OLDNEWa
OLDNEW
:H
:H
mm
m=m
a/2 a/2
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)
• Los supuestos para un t-test de dos muestras son:
− Ambas muestras están distribuidas normalmente
− Ambas muestras tienen igual varianza
• Use Minitab para comprobar la normalidad
• Deje que Minitab decida si las varianzas son iguales
Desarrollo: Abra archivo HYPOTHE
Vaya a Stat > Basic
Statistics > Normality
test…
El cuadro de diálogo
Normality Test aparecerá
como se muestra
Hacerlo para el Viejo y el
Nuevo diseño
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
NewDesign
Pe
rce
nt
9692888480
99
95
90
80
70
60
50
40
30
20
10
5
1
Mean
0.647
86.2
StDev 3.576
N 9
AD 0.251
P-Value
Probability Plot of NewDesignNormal
OldDesign
Pe
rce
nt
92.590.087.585.082.580.077.575.0
99
95
90
80
70
60
50
40
30
20
10
5
1
Mean
0.840
84.21
StDev 3.076
N 9
AD 0.197
P-Value
Probability Plot of OldDesignNormal
Ambos valores p son mayores a 0.05, se asume que los datos son normales.
Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
1. Indique Samples in
different columns
2. Resalte C1 Old Design
3. Presione Select
4. Aparecerá Old Design
en la ventana First.
5. Repita los pasos 2, 3, y
4 para C2 New Design
6. Seleccione Options
Vaya a Stat>Basic Statistics>2-Sample t… .
El cuadro de diálogo 2-Sample t (Test and Confidence Interval)
aparecerá como se muestra
1
2
3
6
5 4
NO asuma varianzas iguales
Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
1. Verifique Confidence
level: (debería ser
1 – alfa)
2. Verifique Alternative:
(esta es la hipótesis
alternativa—muestra
como considerará la
distribución alternativa
si la hipótesis nula es
falsa)
3. Seleccione OK
4. Seleccione OK de
nuevo en el cuadro de
diálogo 2-Sample t
Distribución Nula
Distribuciones alternativas posibles
1
2
3
Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
La Ventana de Sesión de Minitab muestra los resultados del
análisis estadístico :
p-value > 0.05: no se puede rechazar Ho
Two-Sample T-Test and CI: OldDesign, NewDesign Two-sample T for OldDesign vs NewDesign N Mean St Dev SE Mean OldDesign 9 84.21 3.08 1.0 NewDesign 9 86.20 3.58 1.2 Difference = mu (OldDesign) - mu (NewDesign) Estimate for difference: -1.98889 95% CI for difference: (-5.34050, 1.36273) T-Test of difference = 0 (vs not =): T-Value = -1.26 P-Value = 0.225 DF = 15
Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Llevando a cabo un t-test usando Minitab: Ejemplo 3
1. Indique Samples in
difference columns
2. Resalte C1 Old Design
3. Presione Select
4. Old Design aparecerá
en la ventana First
5. Repita pasos 2, 3, y 4
para C2 New Design
6. Seleccione Options
Supongamos que queremos determinar si el Nuevo Diseño es más
grande que el Viejo Diseño, eso es mOLD < mNEW ?
1
2
3
6
5 4
NEWOLDa
NEWOLD0
:H ,
:H ,
mm
mm
aAlternativHipótesis
NulaHipótesis
NO asuma varianzas iguales
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
1. Verifique Confidence
level: (debería ser 1 – α)
2. Verifique Alternative:
(esta es la hipótesis
alternativa—muestra
como considerará a la
distribución alternativa si
la hipótesis nula es falsa)
3. Seleccione OK
4. Seleccione OK de nuevo
en el cuadro de diálogo 2-
Sample t
Distribución Nula
Distribución alternativa
1
2
3
Llevando a cabo un t-test usando Minitab: Ejemplo 3 (Continuación)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
La Ventana de Sesión de Minitab muestra los resultados del análisis estadístico :
p-value > 0.05: no se puede rechazar Ho
Two-Sample T-Test and CI: OldDesign, NewDesign Two-sample T for OldDesign vs NewDesign N Mean St Dev SE Mean OldDesign 9 84.21 3.08 1.0 NewDesign 9 86.20 3.58 1.2 Difference = mu (OldDesign) - mu (NewDesign) Estimate for difference: -1.98889 95% upper bound for difference: 0.76771 T-Test of difference = 0 (vs <): T-Value = -1.26 P-Value = 0.113 DF = 15
Si la prueba pasa el test de 2 colas , pasará el de 1 cola. Esto puede simplificar mucho el análisis.
Llevando a cabo un t-test usando Minitab: Ejemplo 3 (Continuación)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ensayo de Hipótesis: Ejercicio 1
Conocemos que el tiempo promedio para procesar una orden de
cliente es 4.36 horas. El tiempo de procesamiento de órdenes es un
parámetro de cliente Crítico al Despacho. Cuanto más rápido, mejor.
Se ha propuesto un nuevo proceso. Es el nuevo proceso, al menos,
tan bueno como el viejo proceso?
Deseamos detectar un cambio de 1 hora, y la desviación estándar
histórica del proceso es 1 hora.
Nuestro riesgo beta es 20%, y el riesgo alfa, 5%.
Cuál debe ser nuestro tamaño de muestra?
Nota: ya que este va a ser un test de una sola cola, el tamaño de muestra será menor que para uno de dos colas. Sin embargo, si el nuevo proceso es más rápido que el actual, deseamos detectar el cambio de una hora (negativa); ello es, el efecto de -1 hora. Si no usamos “-1”, Minitab nos dará un mensaje de error.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ensayo de Hipótesis: Solución al Ejercicio 1
Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus <) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Assumed standard deviation = 1 Sample Target Difference Size Power Actual Power -1 14 0.80 0.824086 -1 18 0.90 0.902272 -1 23 0.95 0.954817 -1 33 0.99 0.991195
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ensayo de Hipótesis: Ejercicio 2
• Conocemos que el tiempo promedio para procesar una orden de cliente es 4.36 horas. El tiempo de procesamiento de órdenes es un parámetro de cliente Crítico al Despacho. Cuanto más rápido, mejor
• Se recolectaron datos para el nuevo proceso. Es el nuevo proceso más rápido que el viejo?
• Abrir archivo HYPOTHE2.
Nota: este es un 1 Sample t-test, donde el estándar (media del test = 4.36 horas) puede ser tratada como la Hipótesis alternativa Ha
Tiempo de proceso 3.79440 3.78220 3.82508 3.97836 3.73360 3.88021 3.93502 3.92548 3.89989 3.73931 3.71954 3.81429 3.86097 3.81711
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ensayo de Hipótesis: Solución al Ejercicio 2
1. Resalte C1 Order Time
2. Presione Select 3. Aparecerá Order Time
en la ventana Variable 4. Tipee 4.36 en Test
mean: 5. Seleccione Options
1
2
3
4
5
Seleccione 1-Sample t (Test and Confidence Interval)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Ensayo de Hipótesis: Solución al Ejercicio 2 (Cont)
1. Verifique Confidence level:
2. Seleccione less than en Alternative:
3. Seleccione OK 4. Seleccione OK en
cuadro de diálogo 1-Sample t
p-value <= 0.05: se rechaza la hipótesis nula
One-Sample T: Order Time Test of mu = 4.36 vs < 4.36 95% Upper Variable N Mean St Dev SE Mean Bound T P Order Time 14 3.83610 0.08024 0.02145 3.87408 -24.43 0.000
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Que hemos aprendido ...
1. Pasos en el Ensayo de Hipótesis
2. Riesgos Alfa (a) y Beta (b)
3. Calcular Tamaño de Muestra
4. Usar el t-test para comparar dos medias
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Tarea para el hogar
1. Se evalúan dos procesos de facturación para determinar cuál lo hace en menor tiempo. Qué proceso seleccionaría y por qué? \DataFile\HYPOTHE3.mtw
2. Se comparan los diseños de dos receptores respecto a su ganancia. Se toman diez muestras de Producción y de Productos Terminados, que representan la variación total existente en la fábrica. Cada receptor es ensayado y luego modificado con el nuevo diseño. Qué diseño elegiría y por qué? \DataFile\HYPOTHE4.mtw
Analice los siguientes problemas, y prepárese para exponer sus
conclusiones y razonamiento que le condujo a ellas:
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Material Suplementario
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Católica del Perú.
Primero se calcula el estadístico del ensayo: Donde:
0 es la diferencia que tratamos de detectar (típicamente 0)
s(x1-x2) es el error estimado de la diferencia entre las dos medias
Si asumimos igual varianza para ambas muestras, • se calcula una varianza global (“pooled”) que depende del tamaño de
la muestra (ver Ayuda de Minitab: Calculations for Two Sample t-Tests),
A continuación se calcula el valor de t crítico: tcrit=tα/2,DF
DF = n1+ n2 -2 para estimación “pooled” ( varianzas iguales)
DF =
Si t > tcrit , rechazar la hipótesis nula
Finalmente se calcula un valor de probabilidad: Si esta probabilidad es menor que el valor a elegido, se rechaza la
hipótesis nula
¿Cómo funciona una prueba t para dos muestras?
2
2
2
1
2
1
2
2
2
2
2
1
2
1
2
12
2
2
2
1
2
1 s 11 n
s
n
s
n
n
s
n
n
s
n
s
n
s=
21
021
xxs
xxt
=
(varianzas desiguales)