Sesión 8Sesión 8Dos Poblaciones y ANOVADos Poblaciones y ANOVA
Estadística en las organizaciones CD4001
Dr. Jorge Ramírez Medina
Análisis de VarianzaAnálisis de Varianza
• Analysis of variance (ANOVA) . Es utilizado para probar la media de dos o más poblaciones. La hipótesis nula, típicamente, es que todas las medias son iguales.
• Esta técnica es una extensión de la prueba t de dos muestras.
• Adicional a conocer las diferencias entre las medias, puede ser de interés conocer cuál media difiere.
• El análisis de varianza y covarianza se examinan diferencias en los valores medios de la variable dependiente asociados con el efecto de las variables controladas, después de tomar en cuenta la influencia de las variables independientes no controladas
Dr Jorge Ramírez MedinaEGADE Business School
Tomemos un ejemploTomemos un ejemplo
• Convenience
Dr Jorge Ramírez MedinaEGADE Business School
¿Cómo promocionar un nuevo producto (concentrado de manzana)
Tomemos un ejemploTomemos un ejemplo
Dr Jorge Ramírez MedinaEGADE Business School
Convnce Quality Price529 804 672658 630 531793 774 443514 717 596663 679 602719 604 502711 620 659606 697 689461 706 675529 615 512498 492 691663 719 733604 787 698495 699 776485 572 561557 523 572353 584 469557 634 581542 580 679614 624 532
Convnce Quality Price529 804 672658 630 531793 774 443514 717 596663 679 602719 604 502711 620 659606 697 689461 706 675529 615 512498 492 691663 719 733604 787 698495 699 776485 572 561557 523 572353 584 469557 634 581542 580 679614 624 532
Weekly sales
Weekly sales
Weekly sales
SoluciónSolución
Dr Jorge Ramírez MedinaEGADE Business School
H0: 1 = 2= 3
H1: At least two means differ
NotaciónNotación
Dr Jorge Ramírez MedinaEGADE Business School
Muestras independientes tomadas de k poblaciones (tratamientos).
1 2 kX11
x21
.
.
.Xn1,1
1
1x
n
X12
x22
.
.
.Xn2,2
2
2x
n
X1k
x2k
.
.
.Xnj,k
j
j
x
nTamaño de la muestra
Media de la muestra
Primera observación,Primera muestra
Segunda observación,Segunda muestra
X es la “variable de respuesta”. Los valores son llamados “observaciones”
NotaciónNotación
En el contexto de este Problema:
Variable de respuesta: Las ventas semanales
Observaciones: valor de las venta real
Unidad de análisis: Las tres ciudades
Tratamiento :Criterio por el cual se clasifican las poblaciones (los tratamientos). En este problemas el factor es la estrategia de mercadotecnia.Niveles de los tratamientos: Las diferentes estrategias de mercadotecnia; Conveniencia, Precio, Calidad.
Dr Jorge Ramírez MedinaEGADE Business School
Análisis de VarianzaAnálisis de Varianza
Dr Jorge Ramírez MedinaEGADE Business School
22
x n
2x3x 1x
Las medias de las muestras están “cercanas entresí”, porque sólo hay una distribución muestral cuandoH0 es verdadera
Las medias de las muestras están “cercanas entresí”, porque sólo hay una distribución muestral cuandoH0 es verdadera
Análisis de VarianzaAnálisis de Varianza
Dr Jorge Ramírez MedinaEGADE Business School
2x3x 1x
Las medias de las muestras provienen de distintasdistribuciones muestrales y no están tan cercanasentre sí cuando H0 no verdadera
Las medias de las muestras provienen de distintasdistribuciones muestrales y no están tan cercanasentre sí cuando H0 no verdadera
Descomposición de Descomposición de la variaciónla variación
Dr Jorge Ramírez MedinaEGADE Business School
• SSentre. Estimación de la variabilidad entre tratamientos, también se le denota por SSx, esta es la variación en X relacionada a la variación en las medias de cada muestra. Se le conoce como SCTR suma de los cuadrados debido a los tratamientos.
• SSdentro. variación dentro de cada una de las muestras, también denotada como SSerror, es la variación en X debido a la variación dentro de cada una de las muestras. Se le conoce como SCE, suma de cuadrados debido al error
• SSy. Es la variación total. Se le conoce como STC, suma de cuadrados del total
STC = SCTR + SCE
El estadístico FEl estadístico F
Dr Jorge Ramírez MedinaEGADE Business School
Hipótesis:
H0: 1=2=3=. . . = kHa: No todas las medias de la población son igualesEstadístico de prueba:
Regla de rechazo: Rechazar H0 if F > F
Donde el valor de F esta basado en una distribución F con k - 1 grados de libertad en el numerador y nT - 1 grados de libertad en el denominador
Distribución de Distribución de muestreo muestreo
de CMTR/CMEde CMTR/CME
Dr Jorge Ramírez MedinaEGADE Business School
No rechazar H0No rechazar H0 Rechazar H0Rechazar H0
CMTR/CMECMTR/CME
Valor CríticoValor CríticoFF
Análisis de VarianzaAnálisis de Varianza
Dr Jorge Ramírez MedinaEGADE Business School
Acerca de los grados Acerca de los grados de libertadde libertad
Dr Jorge Ramírez MedinaEGADE Business School
• Distribución χ2
• Demostración de grados de libertad
2
2 1
ns
Tabla ANOVATabla ANOVA
Dr Jorge Ramírez MedinaEGADE Business School
2
2 1
ns
Ejemplo; Estrés laboral
Dr. Jorge Ramírez MedinaITESM EGADE
Sistema A
Sistema B
Sistema C
ANOVA dos factores
Dr. Jorge Ramírez MedinaEGADE Business School
Curso de 10 semanasPrograma de un día
Repaso de tres horas
Administración
Ciencias
Ingeniería
Qué tipoQué tipo de relaciónde relación
se examina?se examina?
Cuántas son Cuántas son las variables las variables
a predecir?a predecir?
Dependencia Interdependencia
Cuál es la escala Cuál es la escala de medición de de medición de
la variable la variable dependiente?dependiente?
Cuál es la escala Cuál es la escala de medición de de medición de
la variable la variable dependiente?dependiente?
Cuál es la escala Cuál es la escala de medición de de medición de
la variable la variable predictora?predictora?
SEMSEM
Múltiples relaciones deVariables dependientes eindependientes Varias variables
dependientes en una sola relación
Una variable dependientes en una sola relación
Correlación Correlación canónicacanónica
Análisis Análisis Multivariado Multivariado de varianza de varianza
(Manova)(Manova)
Correlación Correlación canónica canónica
con variables con variables dummydummy
Regresión múltipleRegresión múltipleAnálisis ConjointAnálisis Conjoint
Análisis discriminante Análisis discriminante múltiplemúltiple
Modelos de Modelos de probabilidad lineal probabilidad lineal
(logit Analysis)(logit Analysis)
Métrica No Métrica
Métrica No Métrica
No MétricaMétrica
Correlación canónica
Y1+Y2+Y3+…+Yn = X1+X2+X3+…+Xn
métrica, no métrica métrica, no métrica
Manova
Y1+Y2+Y3+…+Yn = X1+X2+X3+…+Xn
métrica no métrica
Análisis de Varianza
Y1 = X1+X2+X3+…+Xn
métrica no métrica
Análisis discriminante múltiple
Y1= X1+X2+X3+…+Xn
no métrica (dicotómica) métrica
Análisis de regresión múltiple
Y1= X1+X2+X3+…+Xn
métrica métrica, no métrica
Análisis Cojoint
Y1= X1+X2+X3+…+Xn
métrica, no métrica no métrica
SEM
Y1 =Y2 =Ym =
X11+X12+X13+…+X1n
X21+X22+X23+…+X2n
Xm1+Xm2+Xm3+…+Xmn
métrica métrica, no métrica
Relación entre los métodos de dependencia multivariados
Modelo de regresión Modelo de regresión lineal simplelineal simple
• Modelo de regresión lineal simple y = 0 + 1x +
• Ecuación de regresión lineal simpleE(y) = 0 + 1x
• Ecuación estimada de regresión lineal simpley = b0 + b1x
^
Dr Jorge Ramírez MedinaEGADE Business School
When ANOVA is the When ANOVA is the Correct TestCorrect Test
Evaluación final
Dr. Jorge Ramírez MedinaEGADE Business School
Fin Sesión Ocho