Profesora: Dra. Alejandrina Gonzales Ochoa 1. 1. Medidas de asociación entre dos variables...
-
Upload
maria-saez-blazquez -
Category
Documents
-
view
234 -
download
6
Transcript of Profesora: Dra. Alejandrina Gonzales Ochoa 1. 1. Medidas de asociación entre dos variables...
Profesora: Dra. Alejandrina Gonzales Ochoa
SESIÓN 08:MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES
Y TEOREMA DE CHEVYSHEV
Estadística Aplicada a la Gestión Empresarial
1
1. Medidas de asociación entre dos
variables
ESTADÍSTICA DESCRIPTIVA
Medidas de asociación entre dos variables
Hasta ahora hemos examinado métodos numéricos cuyo objetivo es resumir los datos de una sola variable. Con frecuencia al gerente o quien toma decisiones le interesa la relación entre dos variables.
A continuación se presenta la covarianza como medida descriptiva de la relación entre dos variables.
3
Medidas de asociación entre dos variables
1. Covarianza:
Para un conjunto de observaciones, la covarianza se define como:
Covarianza de una muestra: Covarianza de una población:
1
))((_
1
_
n
yyxxS
i
n
ii
xy N
YX yix
N
ii
xy
))((1
4
Ejemplo
El departamento de logística de una tienda de equipos de sonido, ha usado comerciales de televisión los fines de semana para promover sus ventas. El administrador de la tienda le interesa investigar la relación entre la cantidad de comerciales de televisión que aparecen los fines de semana y las ventas en su negocio durante la siguiente semana. En la siguiente tabla aparecen datos de la muestra, donde las ventas se expresan en miles de dólares, con una observación para cada semana.
5
Muestra de datos del departamento de logística
Semana Cantidad de comercialesx
Volumen de ventasy
1 2 50
2 5 57
3 1 41
4 3 54
5 4 54
6 1 38
7 5 63
8 3 48
9 4 59
10 2 466
Cálculo de la covarianza de la muestra
xi yi
2 50 -1 -1 1
5 57 2 6 12
1 41 -2 -10 20
3 54 0 3 0
4 54 1 3 3
1 38 -2 -13 26
5 63 2 12 24
3 48 0 -3 0
4 59 1 8 8
2 46 -1 -5 5
30 510 0 0 99
_
)( yyi _
)( xxi )()(__
yyxx ii
7
Reemplazando valores en la fórmula:
11110
99
110
))((_10
1
_
yyxxS
ii
i
xy
Interpretación de la covarianza:
Para ayudarnos en la interpretación de la covarianza de la muestra es necesario tomar en cuenta el diagrama de dispersión de x e y
8
Diagrama de dispersión
Interpretación de la covarianza:
En la gráfica quedan cuatro cuadrantes: • Los puntos del cuadrante I corresponde a valores de x mayores que su
media y a valores de y mayores que su media.• Los puntos del cuadrante II corresponde a valores de x menores que
su media y a valores de y mayores que su media.• Los puntos del cuadrante III corresponde a valores de x menores que
su media y a valores de y menores que su media.• Los puntos del cuadrante IV corresponde a valores de x mayores que
su media y a valores de y menores que su media.
10
Interpretación de la covarianza:
Si el valor de Sxy es positivo, los puntos que tuvieron la máxima
influencia sobre Sxy deben estar en los cuadrantes I y III, por
consiguiente un valor positivo de Sxy indica una asociación lineal
positiva entre x e y. Sin embargo si el valor de Sxy es negativo los
puntos que tuvieron mayor influencia sobre Sxy están en los
cuadrantes II y IV, por consiguiente un valor negativo de Sxy indica
una asociación lineal negativa entre x e y.
Si los puntos se distribuyen uniformemente en los cuatro cuadrantes el valor de Sxy será cercano a cero, indicando que no hay asociación
lineal entre x e y.
11
2. Coeficiente de CorrelaciónMide el grado de asociación existente entre variables
FUERTE POSITIVA
0
10
20
30
40
50
60
0 10 20 30 40 50 60
Variable A
Var
iab
le B
FUERTE NEGATIVA
0
10
20
30
40
50
0 10 20 30 40 50
Variable A
Va
ria
ble
B
SIN CORRELACIÓN
0
10
20
30
40
50
60
0 10 20 30 40 50 60
Variable A
Var
iab
le B
12
Interpretación:
n
ii
n
ii
n
iii
ynyxnx
yxnyxr
1
22
1
22
1
01-1 0.70-0.70
Fórmula:
13
Ejemplo:Analizar la relación entre la edad y el tiempo de servicio de 15 trabajadores, contando con la siguiente información:
Trabajador Edad Tiempo de
servicio
Trabajador Edad Tiempo de
servicio
1 48 24 9 34 10
2 40 18 10 46 20
3 30 9 11 32 12
4 39 14 12 42 18
5 46 22 13 40 16
6 42 22 14 32 8
7 27 4 15 27 6
8 36 13
14
Reemplazando valores en la fórmula el coeficiente de correlación es:
97.0
1
22
1
22
1
n
ii
n
ii
n
iii
ynyxnx
yxnyxr
01-1 0.70-0.70
Existe una correlación fuerte (0.97) entre la edad y el tiempo de servicio del trabajador.
15
2. Teorema de Chevyshev y regla
empírica
ESTADÍSTICA DESCRIPTIVA
3 m
Curva en forma de campana que muestra la relación entre y
2 1 +1 +2 +3
Teorema de Chebyshev
El teorema de Chebyshev se aplica a cualquier conjunto de datos y se emplea para determinar la cantidad mínima de valores que deben estar dentro de cierta cantidad de desviaciones estándar respecto a la media.
Interpretación y usos de la desviación estándar
Regla empírica: para datos con una distribución en forma de campana:
• Aproximadamente 68% de los valores de la población estará dentro de 1 desviación estándar a partir de la media.
• Aproximadamente 95% de los valores de la población estará dentro de 2 desviación estándar a partir de la media.
• Aproximadamente 99% de los valores de la población estará dentro de 3 desviación estándar a partir de la media.
19