Estadística y probabilidades cap IV

15
ESTADÍSTICA Y ESTADÍSTICA Y PROBABILIDADES PROBABILIDADES UNHEVAL- 2009 UNHEVAL- 2009 Mg. VARGAS RONCAL, Mg. VARGAS RONCAL, Rosario Rosario

Transcript of Estadística y probabilidades cap IV

Page 1: Estadística y probabilidades cap  IV

ESTADÍSTICA Y ESTADÍSTICA Y PROBABILIDADESPROBABILIDADES

UNHEVAL- 2009UNHEVAL- 2009

Mg. VARGAS RONCAL, RosarioMg. VARGAS RONCAL, Rosario

Page 2: Estadística y probabilidades cap  IV

CAPÍTULO IV. MEDIDAS DE CAPÍTULO IV. MEDIDAS DE DISPERSIÓN Y DE FORMADISPERSIÓN Y DE FORMA

Page 3: Estadística y probabilidades cap  IV

4.1 MEDIDAS DE DISPERSIÓN4.1 MEDIDAS DE DISPERSIÓN

• Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. .

• Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. .

Page 4: Estadística y probabilidades cap  IV

4.1.1 RANGO O AMPLITUD ( R ) 4.1.1 RANGO O AMPLITUD ( R )

• Es la diferencia entre las medidas mayor y menor de un conjunto de datos.

• Datos no agrupados R = Xmax-XminXmax: dato mayor Xmin: dato menor • Datos agrupados• R = Ls – Li Ls: límite mayor y Li: límite menor

• PROPIEDADES DEL RANGO• Es fácil de calcular y sus unidades son las mismas que las de la

variable.• No utiliza todas las observaciones (sólo dos de ellas);• Se puede ver muy afectada por alguna observación extrema;• El rango aumenta con el número de observaciones, o bien se

queda igual. En cualquier caso nunca disminuye.

Page 5: Estadística y probabilidades cap  IV

4.1.2 RANGO INTERCUARTÍLICO (RIQ).4.1.2 RANGO INTERCUARTÍLICO (RIQ).

• Lo calculamos como la diferencia entre el tercero y el primero de los cuartiles.

• RIQ = q3 - q1, el intervalo [q1,q3] contiene al 50% central de los valores muestrales.

Page 6: Estadística y probabilidades cap  IV

  4.1.3 DESVIACIÓN MEDIA (Dm)4.1.3 DESVIACIÓN MEDIA (Dm)Es la media aritmética de todas las diferencias absolutas entre cada observación individual y la media aritmética del conjunto de datos.

Datos no agrupados Datos agrupados

Población

Muestra

u: media de la población ni: frecuencia de clase ixi: punto medio de clase i ; n : total de observacionesN: total de observaciones

Page 7: Estadística y probabilidades cap  IV

4.1.4 VARIANZA (S4.1.4 VARIANZA (S22))Es la media aritmética del cuadrado de las desviaciones de cada uno de los valores respecto a la media.

Datos no agrupados Datos agrupados

Población

Muestra

K: número de intervalos

Page 8: Estadística y probabilidades cap  IV

4.1.6 COEFICIENTE DE VARIACIÓN (CV)

Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos.

A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea.

Población

Muestra

Page 9: Estadística y probabilidades cap  IV

4.2 MEDIDAS DE FORMA4.2 MEDIDAS DE FORMA

• La forma de una distribución de frecuencias se puede describir por su simetría o falta de ella (asimetría) y por su agudeza (curtosis).

Page 10: Estadística y probabilidades cap  IV

4.2.1 ASIMETRÍA4.2.1 ASIMETRÍA

• Otro rasgo interesante en una distribución de frecuencias es si los datos aparecen ubicados simétricamente o no respecto de la media. Si queremos cuantificar la simetría, es necesario conservar la información acerca tanto del signo como de la distancia de cada dato a la media (centro de simetría).

• En el caso en que el coeficiente valga cero la distribución es simétrica alrededor de la media.

• Los valores positivos, indicarán distribuciones con mayor sesgo a la derecha y los valores negativos indicarán un mayor sesgo a la izquierda.

Page 11: Estadística y probabilidades cap  IV

Datos no agrupados Datos agrupados

Población

Coeficiente de Fisher

Coeficiente de Pearson

Muestra

Coeficiente de Fisher

Coeficiente de Pearson

Page 12: Estadística y probabilidades cap  IV

Curva sesgada a la derecha o sesgo positivo f > 0; Sk > 0

Curva sesgada a la izquierda o sesgo negativo f < 0; Sk < 0

Curva simétrica f = 0, Sk = 0

Page 13: Estadística y probabilidades cap  IV

4.2.2 CURTOSIS4.2.2 CURTOSIS

• Miden la mayor o menos concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis, que describe lo picuda o plana que es la distribución, es decir si los datos se concentran demasiado o no, comparados con un modelo de distribución llamado distribución normal.

Page 14: Estadística y probabilidades cap  IV

Datos no agrupados Datos agrupados

Población

Muestra

Page 15: Estadística y probabilidades cap  IV

Platicúrtica Mesocúrtica Leptocúrtica

K=3 Mesocúrticak>3 Lepticúrticak<3 Platicúrtica

NormalMás agudas que la normalMás planas que la normal