Medidas de Variacion

download Medidas de Variacion

of 37

Transcript of Medidas de Variacion

  • 5/28/2018 Medidas de Variacion

    1/37

    ESTADISTICA DESCRIPTIVA

    SESION 3-4

  • 5/28/2018 Medidas de Variacion

    2/37

    Sesin 3 y 4

  • 5/28/2018 Medidas de Variacion

    3/37

    TAREAS

    2.31

    2.71

    2.89

  • 5/28/2018 Medidas de Variacion

    4/37

    Estudio

    enumerativo

    Estadstica

    descriptiva

    Recoleccin

    de datos

    Presentacin

    de datos

    Caracterizacion

    de datos

    Papel de paquetes

    de computacion

    Estadisticas

    Parmetros

    Muestra

    Estudio

    analtico

    PoblacinMejora

    del proceso

    Pensamiento

    estadstico

  • 5/28/2018 Medidas de Variacion

    5/37

    Distribucinde porcentaje

    acumulado

    Distribucinde frecuencia

    relativa

    Distribucinde porcentaje

    Distribucin de

    frecuencia relativa

    acumulada

    Histograma Polgono

    Grfica

    digipunto

    Diagrama de

    tallo y hojas

    Clesificacin

    ordenada

    Presentacin de

    datos nmericos

    No SiTiempo

    ordenado

    Ojiva

    Distribucin de

    frecuencia

  • 5/28/2018 Medidas de Variacion

    6/37

    Polgono

    No agrupados AgrupadosForma de

    datos

    Datos sin

    procesar

    Claificacin

    ordenada

    Diagrama de

    tallos y hojas

    Distribucin

    de frecuenciaOjiva

    Propiedades de datos

    nmericos

    Tendencia

    centralVariacin

    Coeficiente de

    variacin

    Varianza

    Desvio

    estndar

    Forma

    Grafica de

    Caja y bigotesRango

    Rango

    intercuartil

    Media

    Mediana

    Moda

    Rango medio

    Eje medio

  • 5/28/2018 Medidas de Variacion

    7/37

    Total 100%

    Fila 100%

    Columna

    100 %

    Grfica de

    pastel

    Grfica de

    barrasGrfica de puntos

    Diagrama

    De Pareto

    Tabla deresumen

    Supertabla

    Presentacinde

    Datos categoticos

    >2

    1 2

    Tabulaciones cruzadas(Tabla de contigencias)

    Nmero

    de

    variables

  • 5/28/2018 Medidas de Variacion

    8/37

    Resumen Medidas

    Tendencia Central

    Media

    MedianaModa

    Cuartil

    Media geomtrica

    Resumen Medidas

    Variacin

    Variacin

    Desviacin estndar

    Coeficiente

    de Variacin

    Rango

  • 5/28/2018 Medidas de Variacion

    9/37

    Medidas de Tendencia Central

    Tendencia Central

    Media Mediana Moda

    Media Geometrica1

    1

    n

    i

    i

    N

    i

    i

    X

    X n

    X

    N

    1/

    1 2

    n

    G nX X X X

  • 5/28/2018 Medidas de Variacion

    10/37

    Media (Media Aritmtica)

    Media (Media Aritmtica) de un conjuntode datos

    Media simple

    Media de la poblacin

    1 1 2

    n

    i

    i n

    XX X X

    Xn n

    1 1 2

    N

    i

    i N

    XX X X

    N N

    Tamao muestra

    Tamao Poblacin

  • 5/28/2018 Medidas de Variacion

    11/37

    Media (Aritmetica)

    La ms Comn Medida de Tendencia

    Central

    Afectada por Valores Extremos (Outliers)

    (continua)

    0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

    Media = 5 Media = 6

  • 5/28/2018 Medidas de Variacion

    12/37

    Aproximacin a la Media Aritmetica

    Usada cuando la disposicin de los datos no est

    disponible

    n = tamao de la muestrac = nmero de clases

    mj= media de clase

    fj= frecuencia de clase

    Media (Aritmetica(continua)

    1

    c

    j j

    j

    m f

    Xn

  • 5/28/2018 Medidas de Variacion

    13/37

    Mediana

    Medida robusta de Tendencia Central

    No es Afectada por valores Extremos

    En un arreglo ordenado, la Mediana is la Media delos Numeros Si n o N is impar, la mediana is el nmero del medio

    Si n o N is par, la mediana is el promedio de los 2nmeros del medio

    0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

    Mediana = 5 Mediana = 5

  • 5/28/2018 Medidas de Variacion

    14/37

    Moda

    Una medida de Tendencia Central Valor que ocurre con ms frecuencia

    No es afectado por valores extremos

    Puede no haber una Moda Puede haber varias Modas

    Se usa para valores Numericos y Categoricos

    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

    Moda = 9

    0 1 2 3 4 5 6

    No Moda

  • 5/28/2018 Medidas de Variacion

    15/37

    Media Geometrica

    Util para medir Variaciones en el tiempo

    Media Geometrica del retorno sobre la inversin

    Mide la situacin de una inversin en el tiempo

    1/

    1 2

    n

    G nX X X X

    1/1 21 1 1 1n

    G nR R R R

  • 5/28/2018 Medidas de Variacion

    16/37

    Ejemplo

    Una inversin de $100,000 descendi a $50,000 al fin del ao 1 yse recuper a $100,000 al fin del ao 2:

    1 20.5 (or 50%) 1 (or 100% )R R

    ( 0.5) (1)0.25 (or 25%)

    R

    Media del retorno

    Media geomtrica del retorno

    1/ 2

    1/ 2 1/ 2

    1 0.5 1 1 1

    0.5 2 1 1 1 0 (or 0%)

    GR

  • 5/28/2018 Medidas de Variacion

    17/37

    Cuartiles

    Ordenar los datos en 4 Cuartiles

    Posicion del i-th Quartile

    y son Medidas No centrales de ubicacin

    = Mediana, una Medida de Tendencia Central

    25% 25% 25% 25%

    1Q 2Q 3Q

    Datos ordenados: 11 12 13 16 16 17 18 21 22

    1 1

    1 9 1 12 13Position of 2.5 12.5

    4 2Q Q

    1Q 3Q

    2

    Q

    1

    4i

    i nQ

  • 5/28/2018 Medidas de Variacion

    18/37

    Medidas de Variacion

    Variacion

    Varianza Desviacion estndar Coeficiente deVariacion

    Varianza

    Poblacin

    Varianza

    Muestra

    Desviacion

    estndar

    poblacinDesviacion

    estndar

    muestra

    Rango

    Rango intercuartil

  • 5/28/2018 Medidas de Variacion

    19/37

    Rango

    Meadida de Variacion

    Diferencia entre el valor ms grande y el

    ms pequeo de las Observaciones:

    Ignora Cmo est distribuida la data

    Largest SmallestRange X X

    7 8 9 10 11 12

    Range = 12 - 7 = 5

    7 8 9 10 11 12

    Range = 12 - 7 = 5

  • 5/28/2018 Medidas de Variacion

    20/37

    Medida de Variacion

    Diferencia entre el primero y tercer Cuartil

    No es afectado por valores extremos

    3 1Interquartile Range 17.5 12.5 5Q Q

    Rango Intercuartil

    Data in Ordered Array: 11 12 13 16 16 17 17 18 21

  • 5/28/2018 Medidas de Variacion

    21/37

    2

    2 1

    N

    i

    i

    X

    N

    Importante Medida de Variacion

    Muestra Variacion respecto a la media

    Varianza Muestra:

    Varianza Poblacin:

    2

    2 1

    1

    n

    i

    i

    X X

    Sn

    Varianza

  • 5/28/2018 Medidas de Variacion

    22/37

    Desviacion estandar Ms Importante Medida de Variacin

    Muestra Variation respecto a la Media

    Tiene la misma unidad que los datos

    originalesSample Standard Deviation:

    Population Standard Deviation:

    2

    1

    1

    n

    i

    i

    X X

    Sn

    2

    1

    N

    i

    i

    X

    N

  • 5/28/2018 Medidas de Variacion

    23/37

    Approximating the Standard Deviation

    Used when the raw data are not available and the

    only source of data is a frequency distribution

    Standard Deviation(continued)

    2

    1

    1

    sample sizenumber of classes in the frequency distribution

    midpoint of the th class

    frequencies of the th class

    c

    j j

    j

    j

    j

    m X f

    Sn

    nc

    m j

    f j

  • 5/28/2018 Medidas de Variacion

    24/37

    Comparing Standard Deviations

    Mean = 15.5

    s = 3.33811 12 13 14 15 16 17 18 19 20 21

    11 12 13 14 15 16 17 18 19 20 21

    Data B

    Data A

    Mean = 15.5

    s = .9258

    11 12 13 14 15 16 17 18 19 20 21

    Mean = 15.5

    s = 4.57

    Data C

  • 5/28/2018 Medidas de Variacion

    25/37

    Coefficient of Variation

    Measure of Relative Variation

    Always in Percentage (%)

    Shows Variation Relative to the Mean Used to Compare Two or More Sets of Data

    Measured in Different Units

    Sensitive to Outliers

    100%S

    CVX

  • 5/28/2018 Medidas de Variacion

    26/37

    Comparing Coefficient

    of Variation Stock A: Average price last year = $50

    Standard deviation = $2

    Stock B: Average price last year = $100 Standard deviation = $5

    Coefficient of Variation:

    Stock A:

    Stock B:

    $2100% 100% 4%

    $50

    SCV

    X

    $5100% 100% 5%

    $100

    SCV

    X

  • 5/28/2018 Medidas de Variacion

    27/37

    Shape of a Distribution

    Describe How Data are Distributed

    Measures of Shape

    Symmetric or skewed

    Mean =Median =ModeMean

  • 5/28/2018 Medidas de Variacion

    28/37

    Exploratory Data Analysis

    Box-and-WhiskerGraphical display of data using 5-number

    summary

    Median( )

    4 6 8 10 12

    XlargestXsmallest

    1Q 3Q2Q

  • 5/28/2018 Medidas de Variacion

    29/37

    Distribution Shape &

    Box-and-Whisker

    Right-SkewedLeft-Skewed Symmetric

    1Q 1Q 1Q2Q 2Q 2Q3Q 3Q3Q

  • 5/28/2018 Medidas de Variacion

    30/37

    The Empirical Rule

    For Most Data Sets, Roughly 68% of the

    Observations Fall Within 1 Standard Deviation

    Around the Mean Roughly 95% of the Observations Fall Within 2

    Standard Deviations Around the Mean

    Roughly 99.7% of the Observations Fall Within 3

    Standard Deviations Around the Mean

  • 5/28/2018 Medidas de Variacion

    31/37

    The Bienayme-Chebyshev Rule

    The Percentage of Observations Contained Within

    Distances of kStandard Deviations Around the Mean

    Must Be at Least

    Applies regardless of the shape of the data set At least 75% of the observations must be contained within

    distances of 2 standard deviations around the mean

    At least 88.89% of the observations must be contained within

    distances of 3 standard deviations around the mean At least 93.75% of the observations must be contained within

    distances of 4 standard deviations around the mean

    21 1/ 100%k

  • 5/28/2018 Medidas de Variacion

    32/37

    Coefficient of Correlation

    Measures the Strength of the LinearRelationship between 2 QuantitativeVariables

    1

    2 2

    1 1

    n

    i i

    i

    n n

    i i

    i i

    X X Y Y

    r

    X X Y Y

  • 5/28/2018 Medidas de Variacion

    33/37

    Features of Correlation

    Coefficient Unit Free Ranges between1 and 1

    The Closer to1, the Stronger the Negative LinearRelationship

    The Closer to 1, the Stronger the Positive Linear

    Relationship

    The Closer to 0, the Weaker Any Linear

    Relationship

  • 5/28/2018 Medidas de Variacion

    34/37

    Scatter Plots of Data with

    Various Correlation CoefficientsY

    X

    Y

    X

    Y

    X

    Y

    X

    Y

    X

    r= -1 r= -.6 r= 0

    r= .6 r= 1

  • 5/28/2018 Medidas de Variacion

    35/37

    Pitfalls in Numerical Descriptive

    Measures and Ethical Issues

    Data Analysis is Objective

    Should report the summary measures that best meet the

    assumptions about the data set

    Data Interpretation is Subjective

    Should be done in a fair, neutral and clear manner

    Ethical Issues

    Should document both good and bad results

    Presentation should be fair, objective and neutral

    Should not use inappropriate summary measures to distort

    the facts

  • 5/28/2018 Medidas de Variacion

    36/37

    Resumen 3 y 4

    Describe Medidas de Tendencia Central

    Media, Mediana, Moda, Media geomtrica

    Uso de Cuartiles

    Describe Medidas de Variacin

    Rango, Rango Intercuartil, Varianza y Desviacin

    estandar, Coeficiente de variacin Representaciones grficas de la distribucin

    Simetra, Sesgos, Uso grficos de caja y bigote

    Funcin de momento,expresa la cantidad de

    movimiento

    Expresaposicin

  • 5/28/2018 Medidas de Variacion

    37/37

    Resumen

    Descripcin de reglas empricas y

    desigualdad de Chebyshev

    Discusin del Coeficiente de Correlacin

    Trampas dirigidas en estadstica descriptiva

    y aspectos ticos

    (continuacin)