Estadistica y Probabilidades

Post on 11-Dec-2015

43 views 1 download

description

Medidas de Dispersion

Transcript of Estadistica y Probabilidades

Ing. William León Velásquezwjleonv@yahoo.com

Las estadísticas básicas nos permiten tener una visión del comportamiento de una serie de sucesos o eventos a los que denominamos "variables", así tenemos varias herramientas estadísticas como lo son la Media, la Mediana y la Moda.

Pero estas Medidas no sonsuficientes, necesitamosconocer la variabilidad delos datos

ING. WILLIAM LEON V. 2DEFINICIÓN

Las Medidas de Dispersión,son indicadores devariabilidad y cuyaimportancia reside en lanecesidad de tomardecisiones, basadas enestadísticas básicas.

ING. WILLIAM LEON V. 3DEFINICIÓN

Ejemplo: Se tiene una producción de

franelas y se sabe que semanalmente se producen un promedio de 500 franelas, se puede decir que todos los días se producen 100 franelas, pero nada nos garantiza eso porque podrían producirse en sólo dos días 250 franelas y el promedio semanal nos daría idéntico,

ING. WILLIAM LEON V. 4DEFINICIÓN

Si adicionalmente se tiene una Desviación Estándar de 5 franelas, tendremos entonces una mejor comprensión del proceso, pues este último número nos indica que semanalmente se producen entre 495 y 505 franelas, es decir, que diariamente sí se deben producir aproximadamente 100 franelas.

ING. WILLIAM LEON V. 5DEFINICIÓN

La Dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central, generalmente la media aritmética.

ING. WILLIAM LEON V. 6DEFINICIÓN

Observe las dos figuras. La primera presenta una distribución con datos más concentrados alrededor de su promedio 400 que la otra figura con respecto a su promedio 1000, es decir la primera figura es una distribución con menos dispersión.

ING. WILLIAM LEON V. 7DEFINICIÓN

Ejemplos:

• Las figuras siguientes muestran atres distribuciones con promedio 70,sin embargo las tres difieren encuanto a su variabilidad alrededor dela media.

ING. WILLIAM LEON V. 8DEFINICIÓN

poca variabilidad alguna variabilidad gran variabilidad

Ejemplos:

Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron los siguientes puntajes:

ING. WILLIAM LEON V. 9EJEMPLO

GRUPO A GRUPO BPuntaje Nº

estudiantesPuntaje Nº

estudiantes9 2 11 5

10 4 12 1011 6 13 513 4 Total 2015 2

17 2

Total 20

Al calcular el promedio aritmético para ambos grupos se obtiene:

ING. WILLIAM LEON V. 10EJEMPLO

12== BA xx

Este resultado puede conducir a conclusiones equivocadas cuando se está comparando distribuciones, pues se podría pensar que ambas secciones son idénticas en su rendimiento, siendo esto falso ya que observando los datos se aprecia que la sección B es más homogénea. En este caso el promedio no tiene suficiente grado de representatividad por lo tanto poco podrá decirnos acerca de los datos en estudio.

ING. WILLIAM LEON V. 11EJEMPLO

ING. WILLIAM LEON V. 12EJEMPLO

iX

Es necesario entonces calcular otras medidas estadísticas para mostrar cómo varían los datos alrededor del promedio y esto se logra mediante las medidas de dispersión.

1.- Para evaluar la confiabilidad del promedio que se está utilizando:Una dispersión pequeña indica que los datosse encuentran acumulados cercanamente,alrededor de la medida de tendencia centralestablecida. Por tanto, la medida detendencia central se considera confiable obastante representativa de los datos.Por el contrario, una dispersión grandeindica que la medida escogida pararepresentar los datos no es muy confiable,es decir, no es muy representativa delos datos.

ING. WILLIAM LEON V. 13

Es necesario estudiar las medidas de dispersión:

2.- Para apreciar cuán dispersas están dos o más distribuciones:Para poder comparar dos distribuciones defrecuencias entre sí, no sólo necesitamosla medida de tendencia central, sinotambién la dispersión entre lasobservaciones para no elaborarconclusiones erróneas.A mayor medida de dispersión → elgrupo es más heterogéneo.A menor medida de dispersión → elgrupo es más homogéneo o uniforme.

ING. WILLIAM LEON V. 14

Es necesario estudiar las medidas de dispersión:

Cuantifican el grado deconcentración o de dispersión de losvalores de la variable en torno de unpromedio de la distribución.

ING. WILLIAM LEON V. 15

MEDIDAS DE DISPERSIÓN ABSOLUTA

Principales medidas de dispersión absoluta:Rango o Recorrido : RVarianza : S2

Desviación Estándar : S

ING. WILLIAM LEON V. 16

MEDIDAS DE DISPERSIÓN ABSOLUTA

Es la diferencia entre los valores máximo y mínimo de los datos.

Esta medida es muy fácil de calcular sin embargo no es muy recomendable porque sólo toma en cuenta los valores extremos, sin considerar los demás valores.

ING. WILLIAM LEON V. 17

MEDIDAS DE DISPERSIÓN ABSOLUTA

mínXmáxXR −=

Interpretación de Rango:El Rango lo podremos interpretar como la amplitud existente entre una serie de datos, es decir, mide cuán lejos está el valor más pequeño y el valor más grande de la muestra o población.

ING. WILLIAM LEON V. 18

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo de Rango:Si tenemos una producción de franelas y sabemos que diariamente se producen un promedio de 500 franelas, y si un día se produce un mínimo de 415 franelas y otro día se produce un máximo de 573 franelas entonces si vemos el RANGO de producción estará entre 158 franelas, es decir, Podemos tener una producción de 158 franelas a partir del valor mínimo.

ING. WILLIAM LEON V. 19

MEDIDAS DE DISPERSIÓN ABSOLUTA

ING. WILLIAM LEON V. 20

MEDIDAS DE DISPERSIÓN ABSOLUTA

iX

Es un valor numérico que cuantifica el grado de dispersión de los valores de una variable respecto a su media aritmética.

Es el promedio de los cuadrados de las desviaciones de la variable respecto a su media aritmética.

ING. WILLIAM LEON V. 21

MEDIDAS DE DISPERSIÓN ABSOLUTA

ING. WILLIAM LEON V. 22

MEDIDAS DE DISPERSIÓN ABSOLUTA

[ ] ( )

−= 2xiXMXV

Notación: Varianza muestral.

Varianza poblacional.

ING. WILLIAM LEON V. 23

MEDIDAS DE DISPERSIÓN ABSOLUTA

:2S

:2σ

Nota: La varianza nunca es negativa. Cuando la variable toma un único

valor; es decir cuando es constante entonces la varianza es cero.

Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

ING. WILLIAM LEON V. 24

MEDIDAS DE DISPERSIÓN ABSOLUTA

iX

ING. WILLIAM LEON V. 25

MEDIDAS DE DISPERSIÓN ABSOLUTA

∑−∑

−=

2

niX

n2iX

1n1

)x(V

Ejemplo: Calcular e interpretar la varianza de los pesos de

un grupo de personas.

Los datos son los siguientes:56 65 68 70 72 76 78 80

ING. WILLIAM LEON V. 26

MEDIDAS DE DISPERSIÓN ABSOLUTA

⇒ n = 8

ING. WILLIAM LEON V. 27

MEDIDAS DE DISPERSIÓN ABSOLUTA

iX

5658

1iiX =∑

=32940

8

1i2iX =∑

=

2oskil6184,602

8565

832940712

XS ≅=−=

En promedio los pesosdel grupo de personas,se alejan con respecto alpromedio aritmético enaproximadamente 61kilos al cuadrado.

ING. WILLIAM LEON V. 28

MEDIDAS DE DISPERSIÓN ABSOLUTA

a) Si n < 30 :

ING. WILLIAM LEON V. 29

MEDIDAS DE DISPERSIÓN ABSOLUTA

∑=−∑

=−=

2

n

k

1iiXif

nk

1i2iXif1n

12XS

Ejemplo:

1.- Calcular e interpretar la varianza para la siguiente tabla de frecuencias.

ING. WILLIAM LEON V. 30

MEDIDAS DE DISPERSIÓN ABSOLUTA

if

EdadIi

n = 20

4 - 6 46 - 10 5

10 - 16 7 ⇒ n < 30

16 - 20 320 - 30 1

Total n = 20

Nº de personas

if

V ( X ) = 29,21 ≈ 29 años2

En promedio la edad de estas personas se aleja con respecto a su promedio aritmético en aproximadamente 29 años al cuadrado.

ING. WILLIAM LEON V. 31

MEDIDAS DE DISPERSIÓN ABSOLUTA

−=

∑=−∑

=−=

2

20230203200

191

2

n

k

1iiXif

nk

1i2iXif1n

1)X(V

b) Si n ≥ 30 :

ING. WILLIAM LEON V. 32

MEDIDAS DE DISPERSIÓN ABSOLUTA

22i

2 k

1i iXihk

1iXihS

∑=

−∑=

=

22i

2n

k

1i iXif

n

k

1iXif

S

∑=−

∑==

Usando frecuencias relativas:Usando frecuencias absolutas:

Ejemplo:

Calcular e interpretar la varianza de la siguiente tabla.

ING. WILLIAM LEON V. 33

MEDIDAS DE DISPERSIÓN ABSOLUTA

PesoIi

Nº de ingenieros

fi n = 40

⇒ n > 30

50 - 60 6

60 - 70 8

70 - 80 10

80 - 90 9

90 -100 7

Total n = 40

⇒ En promedio el peso de los ingenieros se aleja conrespecto al peso promedio en aproximadamente172 kilos al cuadrado.

ING. WILLIAM LEON V. 34

MEDIDAS DE DISPERSIÓN ABSOLUTA

94,1712

403030

40400236

n

k

1i iXif

n

k

1iXif

S

22i

2 =

−=

∑=−

∑==

Si una muestra de tamaño n se particiona en kmuestras de tamaño cada una con sucorrespondiente promedio aritmético , y

su varianza

ING. WILLIAM LEON V. 35

MEDIDAS DE DISPERSIÓN ABSOLUTA

inix

2iS

1 2 k

2kS2

2S21S

kx2x1xkn2n1n

entonces la varianza para los k gruposjuntos se calcula mediante:

ING. WILLIAM LEON V. 36

MEDIDAS DE DISPERSIÓN ABSOLUTA

2

n

xn

n

)Sx(n

S

k

1iii

k

1i

2i

2ii

2T

+

=∑∑== ∑

=

=k

1iinndonde

Ejemplo: Se tienen tres grupos, de seis, nueve y siete estudiantes

respectivamente. Si las notas correspondientes a cada uno de ellos son:

Grupo 1 :12 16 08 11 10 12 Grupo 2 :17 14 07 13 11 18

13 15 14 Grupo 3 :10 13 11 08 12 09

12

ING. WILLIAM LEON V. 37

MEDIDAS DE DISPERSIÓN ABSOLUTA

= 2,98

En promedio las notas de los estudiantes de los tres grupos se alejan con respecto al promedio total en aproximadamente 3 puntos.

ING. WILLIAM LEON V. 38

MEDIDAS DE DISPERSIÓN ABSOLUTA

( ) 89,809,1222

)24,371,10(7)53,1056,13(9)1,75,11(621

222

2 =−+++++

=∑=

k

iT

S

TS

Es la raíz cuadrada positiva de la varianza y posee las mismas unidades que la media aritmética, las cuales ya no están elevadas al cuadrado como en la varianza.

ING. WILLIAM LEON V. 39

MEDIDAS DE DISPERSIÓN ABSOLUTA

)X(VS =

La desviación estándar o desviación típica aparece para simplificar la interpretación de la varianza.Cuando calculamos la varianza, nos basamos en datos elevados al cuadrado, por lo que, el resultado obtenido debe interpretarse en unidades al cuadrado; por esta razón aparece la desviación estándar como la raíz cuadrada de la variancia.

ING. WILLIAM LEON V. 40

MEDIDAS DE DISPERSIÓN ABSOLUTA

Interpretación de la Desviación Estandar:

Es una medida de distancia promedio de los valores observados a su media. La distancia de cada valor a la media se mide tomando el valor absoluto de la diferencia entre ese valor y la media, es decir, es la distancia de cada dato respecto a su promedio.

ING. WILLIAM LEON V. 41

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo : Si se tiene una producción de

franelas y sabemos que diariamente se producen un promedio de 500 franelas, adicionalmente tenemos también que la desviación es de 25 franelas, tendremos entonces una mejor comprensión del proceso pues este último número nos indica que diariamente se producen entre 475 y 525 franelas

ING. WILLIAM LEON V. 42

MEDIDAS DE DISPERSIÓN ABSOLUTA

Distribuciones con igual promedio aritmético y diferente desviación estándar

ING. WILLIAM LEON V. 43

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplos: 1.- Si la desviación típica

del salario de los ingenieros de sistemas es $1,000 y la media aritmética es $3,000, entonces los salarios de los ingenieros fluctúan entre $2,000 y $4,000 dólares.

ING. WILLIAM LEON V. 44

MEDIDAS DE DISPERSIÓN ABSOLUTA

2.- Calcular ladesviación estándar de lasnotas obtenidas por ungrupo de alumnos del cuartociclo de la Facultad deIngeniería Industrial de laUNMSM en la primeraevaluación de estadística.

12 07 14 11 1618 09 14 10

ING. WILLIAM LEON V. 45

MEDIDAS DE DISPERSIÓN ABSOLUTA

⇒ n = 9

ING. WILLIAM LEON V. 46

MEDIDAS DE DISPERSIÓN ABSOLUTA

1119

1iiX =∑

=4671

9

1i2iX =∑

=

( ) puntos5,325,12XS25,122

9111

9467181

XV ==⇒=−=

Por lo tanto:

Nota: La varianza y la desviación estándar

se utilizan para comparar grupos cuya variable está expresada en las mismas unidades.

Así, el grupo más homogéneo, más uniforme o en el que la media aritmética es más representativa será aquel en el cual la varianza o la desviación estándar es menor.

ING. WILLIAM LEON V. 47

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:En varias semanas consecutivas, los oficiales de policía, Martínez y Castro levantaron las siguientes infracciones por exceso de velocidad:Martínez : 31 38 42 32 39 26 Castro : 35 43 38 37 33 28 27

ING. WILLIAM LEON V. 48

MEDIDAS DE DISPERSIÓN ABSOLUTA

¿Cuál de los oficiales es más homogéneo con respecto al número de infracciones?

Solución:

ING. WILLIAM LEON V. 49

MEDIDAS DE DISPERSIÓN ABSOLUTA

35,872

620863907

51S2

M =

−= 31,95

2

724174898

61S2

C =

−=

2MS2

CS <

El oficial Castro es más homogéneo porque su varianza es menor.

Nota:Una de las aplicaciones de ladesviación estándar es analizarla dispersión a partir de unadistribución teórica, llamadacurva normal; la cual tiene formasimétrica.

ING. WILLIAM LEON V. 50

MEDIDAS DE DISPERSIÓN ABSOLUTA

En este caso se tiene que:

El 68,5% de los datos están dentro del intervalo:

El 95,5% de los datos están dentro del intervalo:

El 99,7% de los datos pertenecen al intervalo:

ING. WILLIAM LEON V. 51

MEDIDAS DE DISPERSIÓN ABSOLUTA

)x,x( σ+σ−

)2x,2x( σ+σ−

)3x,3x( σ+σ−

ING. WILLIAM LEON V. 52

MEDIDAS DE DISPERSIÓN ABSOLUTA

La variancia y la desviacióntípica también tienen suslimitaciones. Similar a la mediaaritmética es vulnerable a lainfluencia de casos extremos.Además, cuando las mediasaritméticas no son iguales ocuando las unidades demedición son distintas, lacomparación de desviacionestípicas puede no sersignificativa.

ING. WILLIAM LEON V. 53

MEDIDAS DE DISPERSIÓN RELATIVA

La medida de dispersión relativa más utilizada es el coeficiente de variación.

ING. WILLIAM LEON V. 54

MEDIDAS DE DISPERSIÓN RELATIVA

Es la desviación estándar dividida sobre la media aritmética multiplicada por 100. El mismo nos permite comparar desviaciones típicas de variables con unidades de medición distintas.

El coeficiente de variación se expresa en unidades independientes de la naturaleza de la variable.

ING. WILLIAM LEON V. 55

MEDIDAS DE DISPERSIÓN RELATIVA

100xSCV ×=

Interpretación del Coeficiente de Variación:

El Coeficiente de Variación, mide la variabilidad relativa a la Media. Expresa la proporción de variabilidad de una característica por cada unidad de la Media.

ING. WILLIAM LEON V. 56

MEDIDAS DE DISPERSIÓN RELATIVA

Ejemplo : Sabemos que la fábrica de textiles produce

500 franelas diarias con una desviación típica de más o menos (±) 25 franelas, entonces, el Coeficiente de Variación será 25/500 = 0,05, es decir, tenemos una variación de 5% en la producción diaria de franelas.

ING. WILLIAM LEON V. 57

MEDIDAS DE DISPERSIÓN RELATIVA

ING. WILLIAM LEON V. 58

MEDIDAS DE DISPERSIÓN RELATIVA

En la práctica, se acostumbra considerar que un coeficiente de variación superior a 50% indica alto grado de dispersión y por lo tanto poca representatividad de la media aritmética.

ING. WILLIAM LEON V. 59

MEDIDAS DE DISPERSIÓN RELATIVA

Ejemplo: Se desea comparar los sueldos de

los trabajadores de dos empresas A y B. Para tal efecto se tienen los datos de la tabla siguiente :

¿Se puede afirmar que los sueldos de los trabajadores de la empresa A son más uniformes? ¿Por qué?

ING. WILLIAM LEON V. 60

MEDIDAS DE DISPERSIÓN RELATIVA

ING. WILLIAM LEON V. 61

MEDIDAS DE DISPERSIÓN RELATIVA

Empresa A Empresa B

Sueldos ( $ ) Nº trabajadores

Sueldos ( S/.) Nº trabajadores

380 10 600-650 7

410 9 650-700 9

450 12 700-750 14

480 8 750-800 6

500 7 800-850 4

Por lo tanto, los sueldos de los trabajadores de la empresa A no son más uniformes; sino los sueldos de la empresa B porque presenta menor coeficiente de variación.

ING. WILLIAM LEON V. 62

MEDIDAS DE DISPERSIÓN RELATIVA

78,439x A = 75,713x B =

55,42SA = 67,59SB

=

%68,910078,439

55,42CVA =×=%36,8100

75,71367,59CVA =×=

Ing. William León Velásquez

ING. WILLIAM LEON V. 64

MEDIDAS DE FORMA

Una distribución es asimétrica cuando sus datos tienden a agruparse hacia uno de los extremos de la distribución.

Cuando una curva es asimétrica, tiene un sesgo.

ING. WILLIAM LEON V. 65

MEDIDAS DE FORMA

El sesgo puede ser de dos tipos: Si los datos tienden a agruparse en las

primeras clases, se dice que el distribución tiene un sesgo positivo o que es asimétrica positiva.

Si los datos tienden a agruparse en las últimas clases de la distribución, se dice que esta tiene sesgo negativo o que es asimétrica negativa.

ING. WILLIAM LEON V. 66

MEDIDAS DE FORMA

Es una medida que se utiliza para evaluar elsesgo de una distribución:

ING. WILLIAM LEON V. 67

MEDIDAS DE FORMA

S)Mex(3CA −

=

Según es grado de asimetría unadistribución puede ser:

ING. WILLIAM LEON V. 68

MEDIDAS DE FORMA

SimétricaCA = 0

Asimétrica positivaCA > 0

Asimétrica negativaCA < 0

Mide el grado de elevación o deagudeza de una distribucióncomparada con la curva normal.

ING. WILLIAM LEON V. 69

MEDIDAS DE FORMA

Según su grado de curtosis, unadistribución puede ser:

ING. WILLIAM LEON V. 70

MEDIDAS DE FORMA

K = 0 K > 0,263 K < 0,263

Indica la deformación vertical de unadistribución de frecuencias.

ING. WILLIAM LEON V. 71

MEDIDAS DE FORMA

Si K = 0,263 ⇒ mesocúrtica.

Si K > 0,263 ⇒ leptocúrtica.

Si K < 0,263 ⇒ platicúrtica.

)PP(2PP

K1090

2575−−

=

ING. WILLIAM LEON V. 72

MEDIDAS DE FORMA

wleonv20@yahoo.com

ING. WILLIAM LEON V. 73