MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

download MODULO  ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

of 60

Transcript of MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    1/60

    ESTADISTICAS DESCRIPTIVA

    Docente:

    LEONEL DELGADO ERASO

    Especialista en Estadstica

    UNIVERSIDAD DE NARIO

    DEPARTAMENTO DE MATEMATICAS ESTADISTICA

    PASTO! "#$%

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    2/60

    PRIMERA UNIDAD

    ESTADISTICA DESCRIPTIVA.

    Conceptos generales sobre estadstica

    Distribuciones de frecuencias.

    Medidas de tendencia central.

    Medidas de dispersin.

    Grficos Estadsticos

    Aplicaciones de las herramientas computacionales estadsticas (Excel !tatgraphics

    !"!!#.

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    3/60

    Conceptos Gene&ales

    DE'INICION DE ESTADISTICA

    La estadstica es (na ciencia )(e est(dia los *+todos! no&*as! &e,las!le-es pa&a la &ecolecci.n! o&,ani/aci.n - an0lisis de datos! pa&a saca&concl(siones 10lidas - to*a& decisiones ace&tadas2

    PO3LACION: Es el con4(nto (ni1e&sal! el con4(nto de &e5e&encia! elc(al est0 con5o&*ado po& todos los ele*entos )(e tienen laca&acte&stica de est(dio2 Una po6laci.n p(ede se& 7nita! 8de ta*a9oN o in7nita2

    MUESTRA: Es (n s(6con4(nto de la po6laci.n2 Es (na pa&te de lapo6laci.n! la c(al de6e c(*pli& con dos &e)(isitos 5(nda*entales: se&aleato&ia - &ep&esentati1a2 La p&i*e&a ;ace &e5e&encia a )(e s(sele*entos de6en selecciona&se al a/a&! - la se,(nda ;ace &e5e&enciaal ta*a9o de la *(est&a2

    DATO: Es la *edida de la o6se&1aci.n2

    VARIA3LES ESTADISTICAS2

    Una 1a&ia6le estadstica es (na ca&acte&stica la c(al al se& o6se&1adaen di5e&entes indi1id(os nos ,ene&a &es(ltados distintos2

    Las 1a&ia6les estadsticas p(eden clasi7ca&se en: CUANTITAVAS -CUALITATIVAS2

    Las 1a&ia6les CUANTITATIVAS se clasi7can en: Contin

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    4/60

    (tilidades dia&ias de (n ne,ocio! la p(nt(aciones en (n e=a*en! elcociente intelect(al! etc2

    Las 1a&ia6les c(antitati1as disc&etas son a)(ellas )(e ad*iten!

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    5/60

    SEGUNDA UNIDAD

    DISTRIBUCIONES DE FRECUENCIAS

    Dist&i6(ciones de 5&ec(encias pa&a 1a&ia6le c(antitati1a disc&eta -1a&ia6les c(alitati1as

    Si tenemos una variable cuantitativa discreta o una variable cualitativa, la

    podemos resumir en una tabla ue recibe el nombre de distribuciones de

    !recuencias" #ara ellos revisemos las si$uientes de%niciones&

    Frecuencias absolutas"fi

    'as !recuencias absolutas es el n(mero de veces ue se repite un dato" 'as

    simboli)aremos con la letra *e!e+ min(scula& fi

    'a suma de las !recuencias absolutas es i$ual al n(mero de datos n -"

    n f1 ? f2 ? f3 ? >> ? fm

    fi

    Observe ue .emos tomado un sub/ndice

    m

    , debido a ue los valores ue

    toma la variable, por lo $eneral son menores ue el n(mero de datos n -

    #ara determinar las !recuencias absolutas se utili)a el conteo o recuento" Se

    escriben los valores ordenados de la variable sin repetirlos" 'ue$o se .ace una

    marca !rente a cada valor tantas veces el dato se encuentre en la lista de

    datos, se recomienda .acer $rupos de cinco marcas" #ara e0plicarlo m1s

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    6/60

    claramente, consideremos los si$uientes datos los cuales podr/an corresponder

    al n(mero de .i2os de 34 !amilia observadas& 5, 6, 7, 8, 5, 8, 5, 7, 5, 8, 6, 5,7,5,

    8, 5, 5

    El conteo o recuento se reali)ar/a as/&

    8 IIII 9 7

    5 IIII III 9 :

    7 III 9 ;

    6 II 9 5

    #or lo tanto, las !recuencias absolutas son 7, :, ;, 5, respectivamente"

    'as Frecuencias Absolutas AcumuladasFi

    'as !recuencias absolutas acumuladas se obtienen mediante sumas sucesivas

    de las !recuencias absolutas" 'as simboli)aremos con la letra *EFE+

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    7/60

    'as !recuencias relativas se calculan dividiendo cada !recuencia absoluta fi

    -, entre el n(mero de datos n -" >eneralmente se las e0presa en porcenta2e

    para su !1cil interpretaci?n" Se denotan @ de%nen as/&

    hi

    fi

    n

    fi

    n100

    'a suma de las !recuencias relativas es i$ual a 3 o al 388"

    h

    1+h

    2+h

    3++hm h i 3 9 388"

    'as Frecuencias Relativas Acumuladas"

    Hi

    'as !recuencias relativas acumuladas se calculan dividiendo cada !recuencia

    absoluta acumulada Fi -, entre el n(mero de datos n -" >eneralmente se

    las e0presa en porcenta2e para su !1cil interpretaci?n" Se denotan @ de%nen

    as/&

    Hi Fi

    n

    Fi

    n100

    Otra !orma de calcular las !recuencias relativas acumuladas es mediante las

    sumas sucesivas de las !recuencias relativas"

    H1 h1

    H2 h2+h1

    H3 h3+h2+h1

    >>>>>>>>>>>>>

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    8/60

    Hm hm++h3+h2+h1 $ $##@

    Observe ue la (ltima !recuencia relativa es el 388 o uno"

    Con cada valor calculado procedemos a construir la distribuci?n de !recuencias,

    la cual es una tabla ue contiene& la variable de estudio, las !recuencias

    absolutas, las !recuencias relativas, las !recuencias absolutas acumuladas @

    !recuencias relativas acumuladas" 'a !orma $eneral de una distribuci?n de

    !recuencias es la si$uiente"

    x i fi Fi hi Hi

    x1

    f1

    F1 h1=

    f1

    n

    H1

    x2

    f2

    F2h2=

    f2

    n

    H2

    x3 f3 F3h3=

    f3

    n

    H3

    " " " " "" " " " "

    xm fm Fm=n

    hm=

    fm

    n

    Hm=100=1

    TOTAL n $$##@

    donde,

    xi : ariable de estudio

    fi : Frecuencias absolutas"

    Fi : Frecuencias absolutas acumuladas"

    hi : Frecuencias relativas"

    Hi : Frecuencias relativas acumuladas"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    9/60

    E2emplo&

    'as pesuera m1s $rande del #uerto de Tumaco, tiene en su n?mina a 78

    empleados" #or le@es del $obierno toda empresa debe dar un subsidio de

    educaci?n a cada .i2o de los traba2adores" El $erente para .acer a2ustes en elpresupuesto de la empresa determina el n(mero de .i2os de los traba2adores

    ue estn estudiando @ obtiene los si$uientes resultados&

    5, ;, 3, 8, ;, 5, 8, 3, ;, 5, ;, 7, ;, 3, 3, 5, ;, 5, 7, 3, 8, 8, 3, 5, ;, 5, 3, 8, ;, 7, 5,

    ;, ;, ;, 7, 5, 3, 3, 8, 5

    Construir una distribuci?n de !recuencias"

    Soluci?n&

    'a variable es el n(mero de .i2os de los empleados de la pesuera los cuales

    estn actualmente estudiando, esta variable es cuantitativa discreta @ toma

    valores de 8, 3, 5, ;, 7"

    El conteo se indica a continuaci?n"

    de .i2os Conteo8 IIII I 9 3 IIII IIII 9 5 IIII IIII 9 38

    ; IIII IIII I 9 337 IIII 9 7

    Aplicando las de%niciones @ las !?rmulas respectivas se obtiene la si$uiente

    distribuci?n de !recuencias"

    B de;i4os

    B dee*plea

    dosFi hi Hi

    8 36 36

    3 36 55,6 ;4,6

    5 38 56 56 5,6

    ; 33 ; 54,6 8

    7 7 78 38 388

    TOTA' 78 388

    Anali)ando los resultados del tercer ren$l?n tenemos ue&

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    10/60

    38empleados de la pesuera, euivalentes al 56 del total, tienen 5 .i2os

    estudiando"

    56empleados de la pesuera, euivalentes al 5,6del total, tienen 5 o

    menos de dos .i2os estudiando"

    Dist&i6(ciones de 5&ec(encias pa&a (na 1a&ia6le c(antitati1a contin(a2

    Si tenemos una variable cuantitativa continua, $eneralmente los datos

    repetidos van .acer mu@ pocos, @ al calcular sus !recuencias absolutas estas,

    tomar1n valores de 3 o 5, en su $ran ma@or/a" En estos casos para anali)ar

    este tipo de variables se recomienda a$ruparla en intervalos, clases o

    cate$or/as" #or e2emplo, al clasi%car a los .abitantes de una re$i?n por su

    edad, podr/amos .acer $rupos de bebes edades .asta el aGo @ medio-, de

    niGos edades .asta los 38 o 35 aGos-, de adolescentes edades .asta los 3: o

    53 aGos-, 2?venes edades .asta los 56 o ;8 aGos-, adultos edades .asta los

    68 aGos-, ma@ores edades .asta los 8 aGos-, tercera edad edades despus

    de los 8-"

    #ara construir una distribuci?n de !recuencias para este tipo de variables,

    consideremos las si$uientes de%niciones&

    Ran$o o recorrido" Es la di!erencia entre el valor m10imo de los datos @ el valor

    m/nimo"

    Rango 9 R Vmximo Vmnimo

    N(mero de intervalos, clase o cate$or/as& A pesar de ser un criterio delinvesti$ador el de ele$ir con cu1ntos intervalos va a traba2ar, la &e,la deSt(&,es, propuesta por Herbert Stur$es, su$iere una !?rmula para determinarcu1ntos intervalos, clases o cate$or/as se debe utili)ar"

    m 1+3,3log (n) ! 'a apro0imaci?n se la .ace sin decimales @

    por e0ceso-

    Nota& 'os intervalos ue se !orman se consideran semiabiertos por derec.a, es

    decir tienen la !orma& J a , b -, este intervalo contiene todos los valores

    comprendidos entre a @ b , inclu@endo a a @ e0clu@endo a b "

    Al$unos autores de%nen de manera di!erente los intervalos, por e2emplo, al

    considerarlo cerrado, es decir de la !orma, Ja,bK al si$uiente intervalo se debe

    iniciar por lo menos 3 milsima m1s $rande ue b"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    11/60

    Amplitud del intervalo" c -" Es la distancia ue .a@ entre el l/mite superior @

    el l/mite in!erior de cada intervalo" No necesariamente todos los intervalos

    deben tener la misma amplitud" Se aconse2a usar la si$uiente !?rmula

    c

    rango

    nmerodeintervalos

    R

    m , 'a apro0imaci?n se la .ace

    por e0ceso" Se puede usar decimales-"

    Construcci?n de los intervalos

    El l/mite in!erior Linf1 -, del primer intervalo es el valor m/nimo de los datos,

    @ el l/mite superior del primer intervalo L

    1 -, se obtiene sumando al valor

    m/nimo la amplitud" Este l/mite superior ser1 el l/mite in!erior del se$undo

    intervalo, de au/ en adelante el proceso se repite .asta !ormar el (ltimointervalo"

    Supon$amos ue deseamos traba2ar con 6intervalos de amplitud 7@ ue el

    valor m/nimo de los datos es de 5;" 'os intervalos se !orman as/&

    #rimerintervalo J5;, 5;L 7- 9 J5; , 54-

    Se$undointervalo J54 , 54L 7- 9 J54 , ;3-

    Tercerintervalo J;3 , ;3L 7- 9 J;3 , ;6-

    Cuartointervalo J;6 , ;6L 7- 9 J;6 , ;-

    Muintointervalo J; , ;L 7- 9 J; , 7;-

    Conteo o recuento&

    Construidos los intervalos empe)amos a ubicar cada dato en uno de ellos,

    .aciendo una marca !rente al intervalo ue lo conten$a" Se recomienda .acer

    $rupos de cinco marcas"

    #ara e0plicarlo m1s claramente, consideremos los intervalos anteriores @ lossi$uientes datos& 56, 78, ;;, ;3, 73, 5:, ;, 75, "

    El conteo o recuento comen)ar/a as/& por !acilidad utili)amos una l/nea como

    marca-

    J5; , 54- I

    J54 , ;3- I

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    12/60

    J;3 , ;6- II

    J;6 , ;- I

    J; , 7;- III

    Observemos ue el dato ;3 se ubic? en el tercer intervalo@ NO en else$undo, debido a ue el se$undo intervalo contiene los datos ma@ores o

    i$uales a 54 @ *eno&esue ;3" Esto debido a ue los intervalos son dela !orma Ja,b-"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    13/60

    donde,

    Linf . & '/mite in!erior de cada intervalo

    L . & '/mite superior de cada intervalo"

    xi &

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    14/60

    En la serie de datos podemos observar ue el peso m/nimo es 76P$" @ el peso

    m10imo es de 385 P$", entonces

    Rango 9 R Vmximo Vmnimo 385Q 76 64

    N(mero de intervalos"

    Aplicando la re$la de Stur$es, tenemos

    m 1+3,3log (n) 1+3,3log (40) !"FF> 7

    'a amplitud de cada intervalo es

    c

    rango

    nmerodeintervalos

    R

    m

    57

    7

    !$"H> :,5

    'os intervalos @ el conteo o recuento se indican en la si$uiente tabla" Recuerde

    ue el l/mite in!erior del primer intervalo es 76 @ su l/mite superior se obtiene

    sum1ndole la amplitud de :,5" Una manera de observar r1pidamente el conteo

    es ordenando los datos, as/"

    76, 7, 65, 67, 66, 64, 6, 8, 3, 5, 5, 7, , , :, , 48, 48, 45, 4;, 4;,

    47, 46, 46, 4, 4, 44, 4:, :8, :5, :7, :, :4, ::, :, 8, ;, 7, 4, 385"

    Peso 8,ConteoLinf . L.

    76 6;,5 III %6;,5 3,7 IIII I 3,7 , IIII II , 44,: IIII IIII I $$44,: : IIII

    : 7,5 IIII II 7,5 385,7 II "

    Con las de%niciones @ !?rmulas correspondientes construimos la si$uiente

    distribuci?n de !recuencias

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    15/60

    $istograma

    %& && '& (& )& *& + ,&

    peso

    ,

    &

    +,

    +&

    -,

    -&

    .,

    p

    o

    rce

    n

    ta

    /e

    "ogono de 0recuencias para "E!1

    %& && '& & )& *& +,&

    peso

    ,

    &

    +,

    +&

    -,

    -&

    ,

    p

    o

    rce

    n

    ta

    /e

    Peso8J,2 Ma&cas de clasexi

    B e*pleadosfi Fi

    hi HiLinf . L .

    76 6;,5 7,3 ; ; 4,6 4,6

    6;,5 3,7 64,; 36 55,63,7 , 6,6 4 3 34,6 78, 44,: 4;,4 33 54 54,6 4,644,: : :3, 7 ;3 38 44,6: 7,5 8,3 4 ;: 34,6 6

    7,5 385,7 :,; 5 78 6 388TOTAL # 388

    El an1lisis de los resultados en la tabla se .ace tal como se indican para el

    tercer ren$l?n, as/&

    4de los empleados de la pesuera, euivalentes al 34,6tienen pesos entre

    los 3,7 P$" @ , P$" #odr/amos decir ue el peso promedio de estos siete

    traba2adores es apro0imadamente de 6,6 P$"

    3de los empleados de la pesuera, euivalentes al 78tienen pesos entre

    los 76 P$" @ , P$"

    Estos resultados los podr/amos observar $r1%camente en un HISTO>RA

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    16/60

    TERCERA UNIDAD

    MEDIDAS DE TENDENCIA CENTRAL! MEDIDAS DE POSICION MEDIDASDE DISPERSION

    MEDIDAS DE TENDENCIA CENTRAL

    'as medidas de tendencia central son valores ue en una serie ordenada de

    datos *tienden+ a ubicarse en el centro" Tambin, se las conoce con el nombre

    de promedios" Entre ellas tenemos&

    'a media aritmtica o promedio aritmtico"'a media aritmtica ponderada"'a media $eomtrica"'a mediana"'a moda2

    Media A&it*+tica o P&o*edio A&it*+tico2

    Es el cociente entre la suma de los datos @ el n(mero de datos n -" Una

    venta2a de este promedio es ue considera la in!ormaci?n de todos los datos, @

    una desventa2a es ue es mu@ sensible a valores e0tremos"

    x x in

    x1+x

    2+x

    3++xn

    n ! para datos

    NO a$rupados

    x (xifi )

    n

    x1f

    1+x

    2f

    2++xmfm

    n ! para datos

    a$rupados"

    Nota& De a.ora en adelante los datos NO a$rupados ser1n auellos ue se

    vienen dados en una lista de datos" 'os datos A$rupados son los ue vienen

    dados en una distribuci?n de !recuencias"

    E2emplo"

    Un clientes de un local ue vende accesorios para computador& una USB en

    58"888 pesos, un mouse en 35"888 pesos, un protector de pantalla "888 pesos

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    17/60

    @ un teclado en 34"888 pesos" El precio promedio de los cuatro productos es de

    37"688" Se calcula as/&

    x x in

    x

    1+x

    2+x

    3++xn

    n

    x 20.000+12.000+9.000+17.000

    4

    58.000

    4 $2H##

    E2emplo"

    El dueGo del local del e2emplo anterior re$istr? la cantidad de los productos de

    las ventas del d/a de .o@" En la si$uiente tabla se resume los precios de cadaart/culo @ las cantidades vendidas de cada producto"

    #roducto #recio CantidadUSB 58"888 7

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    18/60

    x ifix i fi

    USB 58"888 7 :8"888

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    19/60

    Como cada prueba tiene di!erente importancia *ponderaci?n o peso+, no

    podemos aplicar la media aritmtica o promedio aritmtico para calcular el

    punta2e de cada aspirante" Au/ debemos utili)ar la media aritmtica

    ponderadaxp "

    #ara calcular el punta2e promedio ponderado ue obtuvo Roberto debemos

    calcularlo as/&

    xp (xi i)

    i

    x1

    1+x

    2

    2++xmm

    1+2+3++m

    680,70+720,20+800,10

    0.70+0,20+0,10

    70

    1 48 puntos"

    En la tabla se muestran los punta2es promedios ponderados xp -, para los

    dem1s aspirantes"

    No*6&easpi&ante

    Conoci*ientos8#@

    o4a de 1ida8"#@

    Ent&e1ista8$#@ xp x

    Roberto : 45 :8 48 4;,;'uis 46 7 4: 4;,3 45,;

    os 4 43 4: :, 45

    Ana 45 4; 43,6 43,;Rosa 4; 6 :: 45, 46,;

    #or lo tanto, 'uis es el seleccionado para el car$o director del 1rea contable en

    la alcald/a de #asto, con un punta2e promedio de 4;,3puntos"

    Observemos ue calculado la media aritmtica 8 x , Rosa ser/a la

    seleccionada con un punta2e de 46,; puntos, cometiendo el error de darle una

    ponderaci?n de ;;,; a la entrevista @ a las otras dos pruebas cambiando as/

    las re$las de selecci?n"

    CorrectoIncorrec

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    20/60

    Media Geo*+t&ica2

    Se la utili)a cuando los datos crecen en pro$resi?n $eomtrica, es decir, los

    datos aumentan r1pidamente"

    'as !?rmulas de c1lculo son las si$uientes&

    !g n

    (x1x2x3xn ) n

    (xi ) ! para

    datos NO a$rupados

    !g n

    (x1f1x

    2

    f2x3

    f3xmfm)

    n

    (xifi ) ! para datos

    a$rupados

    'os productos dentro de la ra/) suelen ser mu@ $randes, una !orma de traba2ar

    con valores peueGos es utili)ando los lo$aritmos en base 38, as/&

    !g antilog ( log xin ) ! para datos NO a$rupados

    !g antilog( (filogxi)n ) ! para datos a$rupados

    E2emplo&

    Calcular la media $eomtrica de los si$uientes datos& 5, 6, 3:, "68,

    Soluci?n&

    !g n

    (x1x2x3xn )

    4

    (2561989.650 )

    4213"998.400 358,6

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    21/60

    Usando lo$aritmos en base 38 se calcular/a as/&

    !g antilog

    (

    log xi

    n

    )

    antilog ( log2+ log56+log 198+log9.6504 )

    antilog ( 0,3010+1,7482+2,2967+3,98454 ) antilog ( 8,33044 ) antilog (2,0826 ) 120,9484

    Mediana

    'a mediana de una serie de datos ordenadoses el valor ue se encuentra en el

    centro de los datos" Otra !orma es, un valor ma@or al 68 de los datos @ es

    menor ue el otro 68" 'a mediana se la utili)a cuando e0iste un valor

    e0tremo o dato at/pico, en in$ls *outlier+"

    El lu$ar donde se encuentra la mediana se obtiene as/&

    L!e n+1

    2

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    22/60

    Soluci?n&

    'a serie de datos ordenados es& 5, ;3, ;6, ;4, 8"

    El lu$ar de la mediana esL!e

    n+1

    2=

    5+1

    2 ;" Esto indica

    ue el tercer dato es la mediana" Es decir, la mediana es ;6"

    'a interpretaci?n de la mediana es& El 68 de los planes tur/sticos cuestan

    menos de ;6 d?lares @ el otro 68 cuesta i$ual o m1s de ;6 d?lares"

    E2emplo&

    'os pesos de los instrumentos de seis cient/%cos ue inspeccionaron al olc1n>aleras son& 76;8, 7638, 888, 7488, 788, 778 $ramos" Calcular @ anali)ar

    la mediana"

    Soluci?n&

    'a serie de datos ordenados es& 778, 7638, 76;8, 788, 7488, 8882

    El lu$ar de la mediana esL!e

    n+1

    2=

    6+1

    2 ;,6" Esto indica

    ue la mediana se encuentra entre el tercer dato @ el cuarto" Es decir, la

    mediana es4530+4600

    2

    9130

    2 766" Esto si$ni%ca ue el

    68 de los instrumentos vulcanol?$icos pesa menos de 766 $ramos @ el otro

    68 pesa m1s de 766 $ramos"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    23/60

    :8 !amilias via2aron al puerto de Tumaco por una semana" El or$ani)ador @ $u/a

    pre$unto cu1ntas personas por !amilia est1n de acuerdo ue la dieta para

    esa semana sea a base de mariscos" 'os resultados se resumen en la

    si$uiente tabla"

    x i fi 8 383 575 ;8; 354 7

    donde, x i : N(mero de personas ue respondieron a%rmativamente

    fi : N(mero de !amilias"

    Calcular @ anali)ar la mediana"

    Soluci?n&

    Antes de calcular la mediana complementemos la tabla con las !recuencias

    absolutas acumuladas, como se observa en la si$uiente tabla"

    x i fi Fi

    8 38 383 57 ;75 ;8 7; 35 44 7 :8

    #otal #

    #ara determinar el lu$ar de la mediana aplicamos la !?rmula&

    L!e n+12

    80+1

    2

    81

    2 40,5 , lo cual indica

    ue la mediana se encuentra entre el dato de lu$ar 78 @ el dato de lu$ar 73"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    24/60

    El valor de las !recuencias absoluta acumuladas8 Fi ! inmediatamente

    ma@or a 78,6 es 7 ver tabla anterior-, el cual se encuentra en el tercer

    ren$l?n" #or tanto el dato ue ocupa el lu$ar 78 es 5 @ el dato ue ocupa el

    dato de lu$ar 73 es 5, promediando los dos valores se obtiene ue la mediana

    es 5"

    'a interpretaci?n es& En el 68 de las !amilias, nin$una, una o m10imo 5

    personas si desean la dieta a base de mariscos @ en el otro 68 de las

    !amilias, 5 o m1s de dos personas pre%eren la dieta a base de mariscos"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    25/60

    4 5Calcular @ anali)ar la mediana"

    Soluci?n&

    Complementado la tabla, con las !recuencias absolutas acumuladas tenemos

    Sala&ios *ni*os )(ese in1e&ti&an en tecnolo,a N

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    26/60

    !e Linf . ? [(n

    2Fa)fo

    ]c 6 L [ (26

    212)12

    ]2 5 L [(

    1312 )12 ]2 6,34 6,5 sm"

    Es decir, la mediana es 6,5 salarios m/nimos2 'o cual si$ni%ca ue el 68 delas personas invertir/an anualmente en tecnolo$/a 6,5 salarios m/nimos, @ el

    otro 68 de las personas invertir/an m1s de 6,5 salarios m/nimos anualmente

    en tecnolo$/a"

    La *oda o *odo2

    !o

    'a moda o modo se de%ne como el dato de ma@or !recuencia o el dato ue m1s

    se repite" Si una serie de datos tiene una moda se dice ue es unimodal, si

    tiene dos modas se dice ue es bimodal @ si tiene m1s de dos modas se dice

    ue es multimodal"

    E2emplo"

    'a moda de los datos& ;, , 5, 5, 6, , 5, 4, 5, 7, 6, 5, 5 es!o=2 , el cual es

    el dato de ma@or !recuencia"

    E2emplo"

    Una aerol/nea est1 planeando descuentos para los .i2os de sus clientes" Se

    reali)? un estudio a un $rupo de 78 clientes, en el cual la variable de inters

    !ue el n(mero de .i2os por cliente" Se obtuvo la si$uiente in!ormaci?n

    N

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    27/60

    'a moda es!o=2 , @a ue es el n(mero de .i2os ue se repite con ma@or

    !recuencia, en este caso se presenta en 36 clientes"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    28/60

    56 ;8 35;8 ;6 3:;6 78 3678 76 38

    Calcular @ anali)ar la moda"

    Soluci?n&

    'a ma@or !recuencia es 3: @ corresponde al tercer ren$l?n" Este intervalo

    recibe el nombre de clase modal, en el cual se tiene ue&

    Linf . ;8

    &1 3: Q 35 9

    &2

    3: Q 36 9 ;c ;6;8 9 6

    Rempla)ando en la !?rmula de la moda tenemos&

    !o Linf . ? ( &1&1+&2 )

    c 30 L ( 66+3 )

    5

    30 L ( 69 )5 ;;,; aGos"

    'o cual indica ue la edad ue m1s se repite entre los empleados de la

    empresa de turismo es de ;;,; aGos"

    Nota& Se debe aclarar ue en la construcci?n de datos a$rupados con

    intervalos se pierde in!ormaci?n, esto implica ue si tuviramos la lista de

    datos posiblemente la edad ue m1s se repite podr/a ser otro valor, puesto ue

    si los 3: empleados de la clase modal todos tienen edades di!erentes @ los 6

    empleados del primer intervalo tiene la misma edad, entonces la moda

    cambiar/a"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    29/60

    'AS

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    30/60

    Son tres valores (: 3, 5, ;- ue dividen al ran$o o recorrido en cuatro

    partes i$uales, cada una de ellas euivalente al 56"

    El lu$ar de cada cuartil se calcula con la si$uiente !?rmula"

    L'( (( n+1 )

    4

    El cuartil se calcula as/&

    '( Linf . ? [ (n(

    4Fa)

    fo]c

    donde,

    Linf . : '/mite in!erior de la clase cuartil ( Intervalo donde se

    encuentra el cuartil(

    -"Fa & Frecuencia absoluta acumulada anterior a la clase cuartil (

    fo : Frecuencia absoluta de la clase cuartil (

    c : Amplitud de la clase cuartil ( Di!erencia entre el l/mite

    superior @ l/mite in!erior de cada intervalo-

    Como las !?rmulas son mu@ similares a las de la mediana se procede @ anali)a

    de manera euivalente"

    Deciles 8 )(

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    31/60

    Son nueve valores (: 3, 5, ;, 7, 6, , 4, :, "- ue dividen al ran$o o

    recorrido en die) partes i$uales, cada una de ellas euivalente al 38"

    El lu$ar de cada decil se calcula con la si$uiente !?rmula"

    L) ( ((n+1 )10

    El decil ( se calcula asi&

    )( Linf . ? [ (n(

    10Fa)

    fo]c

    Linf . : '/mite in!erior de la clase decil ( Intervalo donde se encuentra

    el decil ( -2

    Fa : Frecuencia absoluta acumulada anterior a la clase decil (

    fo : Frecuencia absoluta de la clase decil (

    c : Amplitud de la clase decil ( Di!erencia entre el l/mite

    superior @ l/mite in!erior de cada intervalo-

    Como las !?rmulas son mu@ similares a la mediana @ los curtiles, se procede @anali)a de manera euivalente"

    Pe&centiles

    Son noventa @ nueve valores (: 3, 5, ;, , - ue dividen al ran$o o

    recorrido en cien partes i$uales, cada una de ellas euivalente al 3"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    32/60

    El lu$ar de cada percentil se calcula con la si$uiente !?rmula&

    L*( ((n+1 )

    100

    El percentil ( se calcula as/&

    *( Linf . ? [(n(100

    Fa)fo

    ]cdonde,

    Linf . : '/mite in!erior de la clase percentil ( Intervalo donde se

    encuentra el percentil ( -2

    Fa : Frecuencia absoluta acumulada anterior a la clase percentil (

    fo : Frecuencia absoluta de la clase percentil (

    c : Amplitud de la clase percentil ( Di!erencia entre el l/mite

    superior @ l/mite in!erior de cada intervalo-

    Como las !?rmulas son mu@ similares a la mediana, los cuartiles @ los deciles,se procede @ anali)a de manera euivalente"

    E2emplo&

    Se reali)? un estudio en el cual se pre$untaba de las utilidades mensuales ue

    ten/an 76 empresas catalo$adas como las m1s $randes del pa/s" #or convenio

    con las empresas no se debe publicar sus nombres ni muc.o menos

    directamente el valor in!ormado, por lo tanto se constru@? una distribuci?n de

    !recuencias con intervalos" 'os resultados se muestran en la si$uiente tabla"

    Utilidad *ens(al8*illones de pesos B de e*p&esas

    Linf . L . fi Fi

    5 6 7 76 : 38 37: 33 36 5

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    33/60

    33 37 3; 7537 34 ; 76

    #$#%L H

    Calcular @ anali)ar '3 , )4 , *29 2

    Sol(ci.n2

    C0lc(lo del c(a&til %2 Euivalente al 46 de los datos-"

    'u$ar del cuartil 3

    L'3 ((n+1 )4 3(45+1 )4 1384 ;7,6" Esto

    indica ue el'

    3 se encuentra entre el dato de lu$ar ;7 @ el dato de lu$ar

    ;6" Adem1s, la !recuencia absoluta acumulada inmediatamente ma@or a ;7,6

    es 75, correspondiente al cuarto intervalo"

    Utilidad *ens(al8*illones de pesos B de e*p&esas

    Linf . L . fi Fi

    5 6 7 76 : 38 37: 33 36 533 37 3; 7537 34 ; 76

    #$#%L H

    #or lo tanto

    Linf . 33

    Fa 5

    fo 3;

    c 37 Q 33 ;

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    34/60

    Rempla)ando en la !?rmula tenemos,

    '3

    Linf . ?

    [(n(4 Fa

    )fo ]c

    11 L

    [ (453

    429

    )13 ]V;

    35,8367

    Esto si$ni%ca ue el 46 de las empresas m1s $randes del pa/s, tienenutilidades mensuales in!eriores a 35W8"367 pesos @ el 56 de las empresas

    m1s $randes del pa/s tienen utilidades mensuales superiores a 35W8"367"

    C0lc(lo del decil 2 Euivalente al 78 de los datos-"

    'u$ar del decil 4

    L) 4 ((n+1)

    10

    4(45+1 )10

    184

    10 3:,7" Esto

    indica ue el)

    4 se encuentra entre el dato de lu$ar 3: @ el dato de lu$ar

    3" Adem1s, la !recuencia absoluta acumulada inmediatamente ma@or a 3:,7

    es 5, correspondiente al tercer intervalo"

    Utilidad *ens(al8*illones de pesos B de e*p&esas

    Linf . L . fi Fi

    5 6 7 76 : 38 37: 33 36 533 37 3; 7537 34 ; 76

    #$#%L H

    Po& lo tanto

    Linf . :

    Fa 37

    fo 36

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    35/60

    c 33 Q : ;

    Rempla)ando en la !?rmula tenemos,

    )4 Linf . ? [(

    n(

    10Fa)

    fo]c 8 L [ (

    45410

    14 )15 ] V;

    :,:

    Esto si$ni%ca ue el 78 de las empresas m1s $randes del pa/s, tienen

    utilidades mensuales in!eriores a :W:88"888 pesos @ el 8 de las empresas

    tienen utilidades mensuales superiores a :W:88"888"

    C0lc(lo del pe&centil "F2 8Euivalente al 5 de los datos-"

    'u$ar del percentil 5

    L*29 ((n+1)

    100

    29(45+1 )100

    1334

    100 3;,;7"

    Esto indica ue el*29 se encuentra entre el dato de lu$ar 3; @ el dato de

    lu$ar 37" Adem1s, la !recuencia absoluta acumulada inmediatamente ma@or a3;,;7 es 37, correspondiente al se$undo intervalo"

    Utilidad *ens(al8*illones de pesos B de e*p&esas

    Linf . L . fi Fi

    5 6 7 76 : 38 37: 33 36 533 37 3; 7537 34 ; 76

    #$#%L H

    #or lo tanto

    Linf . 6

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    36/60

    Fa 7

    fo 38

    c : Q 6 ;

    Rempla)ando en la !?rmula tenemos,

    *29 Linf . ? [ (

    n(

    100Fa)

    fo]c 5 ? [ (

    4529100

    4)10 ] %

    !$H

    Esto si$ni%ca ue el 5 de las empresas m1s $randes del pa/s, tienen

    utilidades mensuales in!eriores a 4W436"888 pesos @ el 43 de las empresas

    tienen utilidades superiores a 4W436"888"

    RANGO PERCENTIL 8 (

    En el e2emplo anterior nos podr/amos pre$untar Mu porcenta2e de las

    empresas tienen utilidades in!erior a 38W688"888 pesos mensuales"

    Estas pre$untas se resuelven calculando el ran$o percentil ( , mediante la

    si$uiente !?rmula, ue se obtiene al despe2ar ( de la !?rmula de los

    percentiles"

    (

    [(*(Linf .

    c

    )fo+Fa

    ]100

    n

    donde!

    *( : #ercentil ( , este valor se ubica en los intervalos @ me determina

    la clase ran$o percentil

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    37/60

    Linf . : '/mite in!erior de la clase ran$o percentil"

    Fa : Frecuencia absoluta acumulada anterior a la clase ran$o percentil"

    fo : Frecuencia absoluta de la clase ran$o percentil"

    c : Amplitud de la clase ran$o percentil" Di!erencia entre el l/mite

    superior @ l/mite in!erior de la clase ran$o percentil-

    E2emplo&

    Resolvamos la pre$unta& Mu porcenta2e de las empresas m1s $randes del

    pa/s tienen utilidades in!erior a 38W688"888 pesos mensuales"

    Soluci?n"

    Se$(n la in!ormaci?n del problema los 38W688"888 pesos, euivalentes a 38,6

    millones de pesos, corresponde a*( 38,6 el cual se encuentra en el

    tercer ren$l?n de la tabla"

    Utilidad *ens(al8*illones de pesos B de e*p&esas

    Linf . L . fi Fi

    5 6 7 76 : 38 37

    : 33 36 533 37 3; 7537 34 ; 76

    #$#%L H

    De donde se tiene ue&

    *( 38,6

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    38/60

    Linf . :

    Fa 37

    fo 36

    c 33 Q : 9 ;

    Rempla)ando en la !?rmula del ran$o percentil se tiene

    ( [(*(Linf .

    c )fo+Fa]100n

    = [(

    10,58

    3 )15+14]10045

    [(2,5

    3)15+14]10045

    [26,5 ]100

    45 6:,

    Es decir, ue el 6:, de las empresas m1s $randes del pa/s tienen unas

    utilidades in!eriores a 38W688"888 pesos mensuales @ el 73,3 de las empresas

    tienen utilidades superiores a 38W688"888 pesos mensuales"

    LAS MEDIDAS DE DISPERSION! VARIACION oDESVIACION

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    39/60

    'as medidas de tendencia central, NO indican ue caracter/stica tienen los

    datos en cuanto a si son parecidos, .omo$neos o tienen poca variabilidad- o

    si son mu@ distintos .etero$neos o tienen variabilidad considerable-" 'as

    medidas de dispersi?n son las ue me indican ue tanta variabilidad tienen los

    datos"

    'as medias de dispersi?n, variaci?n o desviaci?n ue estudiaremos ser1n& El

    ran$o o recorrido, la desviaci?n media, la varian)a, la desviaci?n est1ndar @ el

    coe%ciente de variaci?n"

    El &an,o o &eco&&ido

    Es la di!erencia entre el valor m10imo de los datos @ el valor m/nimo"

    Rango R Vmximo Vmnimo Vmx.

    Vmn.

    Si el ran$o es mu@ $rande @ tenemos mu@ pocos datos, se puede decir, ue los

    datos tienen muc.a variabilidad" #ero si el ran$o es peueGo @ tenemos

    muc.os datos, estos tienen poca variabilidad o son .omo$neos"

    Aunue esta medida es mu@ !1cil de calcular su interpretaci?n es mu@

    sub2etiva, adem1s, (nicamente utili)a los valores e0tremos @ no considera los

    otros datos"

    Des1iaciones con &especto a la *edia2

    Estas no son medidas de dispersi?n, pero se las utili)a para las calcular la

    desviaci?n media @ la varian)a las cuales las estudiaremos a continuaci?n"

    'as desviaciones respecto a la media es la di!erencia entre cada dato @ la

    media aritmtica de los datos, se pueden simboli)ar como& (xix ) ! indican

    ue tan distante se encuentra cada dato con respecto a la media aritmtica" Si

    la di!erencia es ne$ativa el dato se encuentra a la i)uierda de la media @ si espositiva el dato se encuentra a la derec.a de la media, si es cero el dato es

    i$ual a la media"

    Una propiedad de las desviaciones respecto a la media es ue la suma de

    todas ellas es i$ual a cero, es decir,

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    40/60

    (x ix ) #! para datos NOa$rupados

    [(xix)fi ] #! para datos a$rupados

    E2emplo&

    Calcular las desviaciones respecto a la media de los si$uientes datos& , 7, ;, 4,

    5"

    Soluci?n&

    'a media aritmtica de los cinco datos es,

    x

    xin

    x1+x

    2+x

    3++xn

    n

    6+4+3+7+2

    5

    22

    5

    !

    En la si$uiente tabla se calculan las desviaciones respecto a la media @ se

    comprueba la propiedad"

    x i xix

    Q 7,7 9 L3,7 7 Q 7,7 9 8,7

    ; ; Q 7,7 9 3,74 4 Q 7,7 9 L5,5 5 Q 7,7 9 5,7TOTAL (xix ) #

    Des1iaci.n *edia

    'a desviaci?n media es el promedio de los valores absolutos de las

    desviaciones respecto a la media aritmtica" Dic.o de otra manera, es elcociente entre la suma de los valores absolutos de las desviaciones respecto a

    la media @ el n(mero de datos" 'as !?rmulas correspondientes son:

    )! |xix|

    n

    |x1x|+|x2x|+|x3x|++|xnx|n !

    para datos NO a$rupados"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    41/60

    )! [|x ix|fi ]

    n

    |x1x|f1+|x2x|f2+|x3x|f3++|xmx|fmn ! para datos a$rupados"

    E2emplo&

    Calcular la desviaci?n media de los si$uientes datos& , 7, ;, 4, 5"

    Soluci?n&

    'a media aritmtica de los cinco datos es,

    x xi

    n

    x1+x

    2+x

    3++xn

    n

    6+4+3+7+25

    22

    5

    7,7

    En la si$uiente tabla se calculan las desviaciones respecto a la media, sus

    valores absolutos @ los totales"

    x i x ix |xix|

    Q 7,7 9 L3, 3,7 7 Q 7,7 9 8,7 8,7; ; Q 7,7 9 3,7 3,74 4 Q 7,7 9 L5, 5,5 5 Q 7,7 9 5,7 5,7#$#%L (x ix ) # |xix| !

    De la tabla se obtiene ue&)!

    |xix|n

    8,4

    5

    3,:"

    Otra manera de calcularla es

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    42/60

    )! |xix|

    n

    |x1x|+|x2x|+|x3x|++|xnx|n

    |64,4|+|44,4|+|34,4|+|74,4|+|24,4|5

    1,6+0,4+1,4+2,6+2,4

    5

    8,4

    5 3,:"

    Este valor indica ue la distancia promedio a cada uno de los datos con

    respecto a la media aritmtica es de 3,: unidades" Es decir, ue en promedio,

    los datos se separan de la media en 3,: unidades.Adem1s, podr/amos

    ase$urar ue en distribuciones normalesestas distribuciones se estudiar1n en

    las unidades de probabilidad-, ue la ma@or/a de los datos se encuentran entre

    x)!+ x+)!

    VARIANA

    Se podr/a de%nir la varian)a como un promedio de los cuadrados de las

    desviaciones respecto a la media, o como el cociente entre la suma de los

    cuadrados de las desviaciones respecto a la media @ el n(mero de datos" 'as

    unidades de la variable de estudio uedan elevadas al cuadrado @ carecen de

    si$ni%cado real, por tanto, la varian)a no tiene interpretaci?n" 'a varian)a es el

    medio para calcular la desviaci?n est1ndar"

    'as !?rmulas respectivas para el c1lculo de la varian)a son&

    Va&ian/a co&&e,ida

    s2

    (xix )

    2

    n1

    (x1x )2+(x2x )

    2+(x3x )

    2++ (xmx )

    2

    n1 !

    para datos NO a$rupados"

    s2

    [(xix )

    2

    fi ]n1

    (x1x )2f

    1+(x2x )

    2f

    2+(x3x )

    2f

    3++(xmx )

    2fm

    n1! para datos a$rupados2

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    43/60

    'a varian)a corre$ida es la m1s utili)ada para calcular la varian)a de una

    muestra"Se divide entre n1 , porue se est1 estimando un par1metro ue

    es la media poblacional"

    Va&ian/a SIN co&&e,i&

    s2

    (xix )2

    n

    (x1x )2+(x2x )

    2+(x3x )2++ (xmx )

    2

    n!

    para datos NO a$rupados

    s2

    [(xix )2fi ]

    n

    (x1x )2f1+(x2x )

    2f2+(x3x )2f3++(xmx )

    2fmn

    ! para datos a$rupados

    DESVIACION ESTANDAR o TPICA

    'a desviaci?n est1ndar o desviaci?n t/pica es la ra/) cuadrada positiva de la

    varian)a" 'as unidades de la desviaci?n est1ndar son las mismas de la variable

    de estudio, @ por este .ec.o tiene interpretaci?n" Nos indica cu1nto pueden

    ale2arse los datos respecto a la media aritmtica, dic.o de otra manera, ladesviaci?n est1ndar es una medida del $rado de dispersi?nde los datos conrespecto al valor promedio" Esta medida es m1s estable ue el ran$o o

    recorrido @ toma en consideraci?n el valor de cada dato"

    Des1iaci.n est0nda& co&&e,ida

    s s2

    varianacorregida (xix )

    2

    n1!

    para datos NO a$rupados

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    44/60

    s s2

    varianacorregida [(xix )2fi ]

    n1!

    para datos a$rupados

    Des1iaci.n est0nda& SIN co&&e,i&

    s s2

    variana sincorregir (x ix )

    2

    n!

    para datos NO a$rupados"

    s

    s2

    variana sincorregir

    [(xix )2fi ]

    n! para datos a$rupados"

    COE'ICIENTE DE VARIACION

    El coe%ciente de variaci?n es una medida de dispersi?n @ se de%ne como el

    cociente entre la desviaci?n est1ndar @ la media aritmtica" Este carece deunidades @ por tanto se puede e0presar en porcenta2e" Su !?rmula de c1lculo

    es&

    -V s

    x

    s

    x100

    El-V indica ue tan dispersos se encuentran los datos con respecto a la

    media aritmtica" Este es m1s preciso ue la desviaci?n est1ndar"

    El Coe%ciente de variaci?n mide la dispersi?n en trminos de porcenta2e,seGala u tan $rande es la ma$nitud de la desviaci?n est1ndar respecto al

    promedio del con2unto de datos ue se e0amina"

    Si el-V es menor o i$ual al 58 se dice ue el promedio es representativo,

    o ue los datos son .omo$neos

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    45/60

    Si el-V es ma@or al 58, el promedio NO es representativo, o ue los datos

    NO son .omo$neos

    Otra interpretaci?n mu@ similar a la anterior se muestra en la si$uiente tabla

    -V Interpretacin

    Menos del 11% Muy homogneos

    11% al 16% Homogneos

    16% al 26% Heterogneos

    Ms del 26% Muy heterogneos

    E2emplo"

    De los si$uientes datos calcular la media, la desviaci?n media, la varian)a, la

    desviaci?n est1ndar @ el coe%ciente de variaci?n"

    3:, 348, 3, 3:8, 34;"

    Soluci?n"

    Calculemos la media aritmtica

    x x in

    x

    1+x

    2+x

    3++xn

    n

    168+170+196+180+173

    5

    887

    5 344,7

    Calculemos la desviaci?n media

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    46/60

    )! |xix|

    n

    |x1x|+|x2x|+|x3x|++|xnx|n

    |168177,4|+|170177,4|+|196177,4|+|180177,4|+|173177,4|

    5

    9,4+7,4+18,6+2,6+4,45

    42,4

    5 9 :,7:

    Este valor indica ue la distancia promedio a cada uno de los datos con

    respecto a la media aritmtica es de :,7:" Es decir, ue en promedio, los datos

    se separan de la media en :,7: unidades.

    Calc(le*os la Va&ian/a 8co&&e,ida

    s2

    (xix )2

    n1

    (x1x )2+(x2x )

    2+(x3x )2++ (xmx )

    2

    n1

    (168177,4 )2+(170177,4 )2+(196177,4 )2+(180177,4 )2+ (173177,4 )2

    51

    88,36+54,76+345,96+6,76+19,36

    4

    515,2

    4=

    35:,:

    Este valor no tiene an1lisis, es el proceso para calcular la desviaci?n est1ndar"

    Calculemos la desviaci?n est1ndar corre$ida-

    s s2

    varianacorregida (x ix )

    2

    n1

    128,8 33,;6

    Nos indica ue los datos pueden ale2arse de la media aritmtica 33,;6

    unidades o ue los datos se encuentran desviados con respecto del promedio

    en 33,;6 unidades"

    Calculemos el coe%ciente de variaci?n"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    47/60

    -V s

    x

    s

    x100

    11,35

    177,4 8,8;4"" ,7

    Este valor es menor ue el 58, concluimos ue los datos son .omo$neos"

    Se$(n la tabla de an1lisis del-V

    , el ,7 es menor de 33 @ se conclu@eue los datos son mu@ .omo$neos"

    E2emplo"

    Un campesino del municipio del Encano, NariGo 'u$ar donde se encuentra uno

    de los sitios m1s tur/sticos de NariGo, 'a 'a$una de la Coc.a o 'a$o >uamue)-,

    tiene en uno de sus criaderos truc.as arco iris, a las cuales las alimenta con un

    producto e0tra/do de v/sceras de las mismas truc.as sacri%cadas, dic.o

    alimento es rico en prote/nas"

    #ara el control de peso @ tamaGo .a instalado una tecnolo$/a (nica en el

    Departamento de NariGo, en el cual con un so!tXare especial obtiene

    autom1ticamente el peso @ tamaGo de cada una de ellas" El anterior %n de

    semana, tomo mediciones sobre el peso en $ramos- de las truc.as de este

    criadero @ obtuvo los si$uientes resultados"

    Peso8,&2 B t&(c;asfiLinf . L .

    346 3:6 3:6 36 ;836 586 64586 536 38;536 556 5556 5;6 36

    5;6 578 38TOTAL "H#

    Calcular @ anali)ar el peso promedio de las truc.as, la varian)a, la desviaci?n

    est1ndar @ el coe%ciente de variaci?n"

    Soluci?n&

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    48/60

    #ara empe)ar .acer los c1lculos necesitamos determinar las marcas de clase

    xi " 'ue$o reali)ando las operaciones indicadas @ las sumatorias ue

    aparecen en las !?rmulas obtenemos la si$uiente tabla"

    Peso8,&2 Bt&(c;as

    fi

    xi x ifi xix (x2x )2 (x2x )

    2fi

    Linf . L .

    346 3:6 3:8 3"58 54,: 4,3:57 ":6,733:6 36 ;8 38 6"488 34,: ;35,6:57 ";44,74536 586 64 588 33"788 4,: 6:,:57 ;";3,:586 536 38; 538 53";8 5,;5 6,;:57 667,;:45536 556 5 558 6"458 35,;5 363,4:57 ;"7,;757556 5;6 36 5;8 ;"768 55,;5 7:,3:57 4"745,4;

    5;6 57638

    578 5"788 ;5,;53"877,6:5

    7 38"776,:57TOTAL "H# 63"58 75"867,7

    Nota& Esta tabla se constru@e !1cilmente en la .o2a electr?nica, usando las

    operaciones como !?rmulas de E0cel"

    Calc(le*os la *edia a&it*+tica

    x xifi

    n

    51.920

    250 584,:

    Esto si$ni%ca ue el peso promedio de las 568 truc.as ue .a@ en el criadero

    es de 584,: $ramos"

    Calc(le*os la Va&ian/a corre$ida-

    s2 (xix )

    2

    fin1 42.054,42501 3:,:

    Este valor no tiene an1lisis porue las unidades de este valor son $ramos al

    cuadrado"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    49/60

    Calc(le*os la des1iaci.n est0nda&corre$ida-

    s s2

    varianacorregida (x ix )

    2fi

    n1

    168,89 35,64 3;

    Nos indica ue los pesos de las truc.as pueden ale2arse del peso promedio 3;

    $ramos, o ue los pesos de las truc.as se encuentran desviados con respecto

    del peso promedio en 3; $ramos"

    Nota: Si el peso de las truc.as se distribu@en normalmente consultardistribuci?n normal- se puede a%rmar ue apro0imadamente un :,5 de las

    truc.as tiene pesos entre 584,: Q 3; @ 584": L 3;, es decir, .a@ un $ran

    porcenta2e de truc.as cu@os pesos se encuentran entre 37,: $ramos @

    558,: $ramos"

    Calculemos el coe%ciente de variaci?n"

    -V s

    x

    s

    x100

    13

    207,68 8,85 ,5

    Este valor es menor ue el 58, concluimos ue los pesos de las truc.as arco

    iris del criadero son .omo$neos, es decir, los pesos de las 568 truc.as del

    criadero tienen poca variabilidad" Se$(n la tabla de an1lisis del -V , el

    ,5 es menor de 33 @ se conclu@e ue los pesos de las truc.as son mu@

    .omo$neos"

    CUARTA UNIDAD

    GRA'ICOS ESTADISTICOS

    Una manera de representar la in!ormaci?n es mediante los $r1%cos

    estad/sticos" Estos a@udan de manera r1pida a revisar la descripci?n de los

    datos"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    50/60

    'os $r1%cos m1s comunes son&

    El $r1%co o dia$rama de barras .ori)ontales, verticales o en componentes-El $r1%co o dia$rama de l/neas o tra)os"El $r1%co o dia$rama de sectores, circular, de torta o de pastel"'os #icto$ramas"

    El dia$rama de Ca2as @ Bi$otes"El Histo$rama"El pol/$ono de !recuencias'as o2ivas o pol/$ono de !recuencias acumuladas"

    Ha@ otros $r1%cos ue se utili)an se$(n la disciplina, tales como los

    carto$ramas ue se utili)an en las ciencias sociales, la curva de 'oren) ue

    e0plica el Coe%ciente de >ini, el cual lo utili)an los economistas" EYCE',

    STAT>RA#HICS @ S#SS, en la $aler/a de $r1%cos presenta una $ran variedad

    de $r1%cos e incluso en ;D" Otros pauetes estad/sticos presentan $r1%cos

    especiales como las caras de C.ernoZ @ estrellas utili)ados para an1lisis de

    datos multivariados"

    Cada tipo de $r1%co est1 destinado para una labor espec/%ca" Con la pr1ctica

    @ de acuerdo a tus necesidades determinar1s cual utili)ar se$(n tus datos"

    El $r1%co o dia$rama de barras .ori)ontales, verticales o en componentes-

    Es un $r1%co ue utili)a rect1n$ulos .ori)ontales o verticales llamados barras"

    El anc.o de cada barra es arbitrario, pero se debe tener en cuenta ue nin$unade ellas se debe cru)arse o *solaparse+ con otra" El alto de cada barra dependede las !recuencias de los datos" >eneralmente los valores de las variables seubican en el e2e Y, @ las !recuencias en el e2e = $r1%co vertical-" Cuando sevan a anali)ar dos o m1s variables el $r1%co recibe el nombre de $r1%co debarras en componentes, tambin se pueden comparar la misma variable endos periodos distintos con este tipo de $r1%cas"

    E2emplo&

    Se re$istr? en el primer semestre del aGo 5833, la cantidad de USB ue sevendieron en un local donde se comerciali)a accesorios para #C, estos re$istrosse reali)aron en cada uno de los meses" 'a in!ormaci?n se observa en lasi$uiente tabla"

    Mes Cantidad de US3 1endidas8*iles

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    51/60

    enero 56!ebrero 35mar)o ;:abril 7ma@o 35

    2unio 5:

    Construir un dia$rama de barras"

    Soluci?n"

    El $r1%co de barras verticales es el si$uiente" Si ueremos las barras.ori)ontales, ubicamos los meses en el e2e =, @ la cantidad de USB vendidas enel e2e Y-"

    enero !ebrero mar)o abril ma@o 2unio

    5635

    ;:

    7

    35

    5:

    Cantidad de US3 1endidas

    E2emplo&

    Se re$istr? en el primer semestre de los aGos 5833 @ 5835, la cantidad de USBue se vendieron en el mismo local del e2emplo anterior, estos re$istros sereali)aron en cada uno de los meses" 'a in!ormaci?n se presenta en lasi$uiente tabla"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    52/60

    Mes Cantidad de US3 1endidas"#$$

    Cantidad de US3 1endidas"#$"

    enero 56 46!ebrero 35 7mar)o ;: 68abril 7 :7ma@o 35 58

    2unio 5: 65

    Construir un dia$rama de barras en componentes

    Soluci?n"

    El $r1%co de barras en componentes es el si$uiente" Observa ue si tenemosdos variables en cada valor del e2e Y, se $ra%can dos barras" Si se tienen trescomponentes se deber1n $ra%car tres barras, etc"

    El $r1%co o dia$rama de l/neas o tra)os"

    Es un $r1%co ue para tra)arlo se ubican puntos en el plano cartesiano @ lue$ose los une mediante se$mentos de recta, llamados tra)os"

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    53/60

    E2emplos" eamos la in!ormaci?n de los dos e2emplos anteriores en undia$rama de l/neas"

    Cantidad de US3 1endidas "#$$

    El $r1%co o dia$rama de sectores, circular, de torta o de pastel"

    Se utili)a cuando la unidad se puede subdividir" 'a in!ormaci?n la podemosrepresentar en un c/rculo en el cual se muestra la proporci?n o porcenta2eeuivalente a cada parte"

    #ara determinar dic.o porcenta2e .acemos corresponder el total al 388 @mediante regla de tres simple directadeterminamos el porcenta2e ue euivalecada parte"

    #otal 388

    parte x

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    54/60

    De !orma similar .aciendo corresponde el total a ;8[ del c/rculo @ aplicandoregla de tres simple directadeterminamos cu1ntos $rados le corresponde acada parte"

    #otal ;8[

    parte x

    E2emplo"

    'a !acultad de Econom/a de una universidad est1 compuesta por& estudiantes,docente, administrativos @ servicios $enerales" Si las cantidades de personasen cada estamento son las ue aparecen en la si$uiente tabla, representemosesta in!ormaci?n mediante un dia$rama circular"

    Esta*entos CantidadEstudiantes :88Administrativos 388Docente ;78Servicios >enerales :8

    TOTAL $%"#

    Soluci?n"

    Calculando los porcenta2es @ los $rados para cada estamento, @ poder tra)ar el

    $r1%co sin usar .erramientas in!orm1ticas tenemos los si$uientes resultados"

    Esta*entos CantidadPo&cent

    a4es G&ados

    G&adosAc(*(la

    dosEstudiantes :88 8, 53: 53:

    Administrativos 388 4, 54 576

    Docente ;78 56,: ; ;;:

    Servicios>enerales

    :8,3 55

    ;8

    TOTAL $%"# $##@ %#

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    55/60

    El dia$rama circular es el si$uiente, presentado en tres dimensiones

    3:

    5

    Pe&sonal 'ac2 Econo*a

    Estudiantes Administrativos Docente

    Servicios >enerales

    'os #icto$ramas"

    Es una manera de representar la in!ormaci?n, mediante ob2etos o %$uras" Acada %$ura completa se le asi$na un valor al inicio del $r1%co" Esta debee0plicarse por s/ sola"

    El si$uiente $r1%co es un picto$rama ue representa la cantidad de turistasue visitaron la 'a$una de la Coc.a 'a$o >aume), NariGo- los primeros cuatromeses del aGo"

    9 6"888 turistas

    Enero& """"""36"888 turistas

    Febrero&""38"888 turistas

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    56/60

    Si se necesitar1 $ra%car 3;"888 turistas en el mes de !ebrero se $ra%car/a 5%$uras de un turista completas @ una parte de otra"

    El dia$rama de Ca2as @ Bi$otes"

    Este $r1%co se utili)a para anali)ar variabilidad de los datos @ simetr/a, adem1sme determina datos at/picos *outlier+"

    NOTA" #ara comprender los trminos usados en este $r1%co, remitirse a lasesi?n de medidas de posici?n"

    En una serie ordenada de datos o en datos a$rupados podemos calcular los

    tres cuartiles los cuales dividen al ran$o en cuatro partes i$uales" Se aclara ueel se$undo cuartil es i$ual a la mediana" Calculados estos valores construimos

    una ca2a entre el cuartil 3 '

    1 - @ el cuartil ; '

    3 -, con un anc.o

    arbitrario, en medio de la ca2a se ubica el se$undo cuartil '2 - o mediana"

    'ue$o se encuentran dos valores1 @

    2 de la si$uiente !orma&

    1 '11,5('3'1 )

    2

    '3+1,5('3'1 )

    En el medio del anc.o de la ca2a se tra)a una se$mento de recta .asta lle$ar a

    1 @ otro se$mento de recta al otro lado de la ca2a .asta lle$ar a 2 2

    Estos se$mentos de recta reciben el nombre de bi$otes"

    E2emplo"

    Construir un dia$rama de ca2as @ bi$ote para representar los si$uientes datos&

    76, 7, 65, 67, 66, 64, 6, 8, 3, 5, 5, 7, , , :, , 48, 48, 45, 4;, 4;,

    47, 46, 46, 4, 4, 44"

    Soluci?n&

    El lu$ar de un cuartil viene dado por&

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    57/60

    L'( ((n+1 )

    4 ! el cual representa la posici?n del cuartil(

    Entonces tenemos

    L'1 ((n+1)

    4

    1(27+1 )4

    4, el sptimo dato es el cuartil

    3,'

    1= HF

    L'2 ((n+1 )

    4

    2(27+1 )4

    37, el dato de lu$ar 37 es el

    cuartil 3,'1=

    L'3 ((n+1)

    4

    3(27+1 )4

    53, el dato de lu$ar 53 es el

    cuartil 3,'1= %

    Nota& Si los lu$ares de los cuartiles no son e0actos, se promedian los dosvalores o m1s correctamente se interpolan para encontrar el valor del cuartil"#or e2emplo si el lu$ar del cuartil 3 !uera 4,56 indicar/a ue este cuartil seencuentra entre el dato de lu$ar siete @ el dato de lu$ar :, lo cual indica ue elcuartil 3, se calcular/a promediando as/& 6L8-\5 9 6,6" #ero siinterpolamos se calcular/a as/& 6L8,56V86- 9 6,56" #odemos observarue el (ltimo resultado es el m1s correcto"

    A.ora calculemos los bi$otes,

    1 '11,5('3'1 ) HF Q $!H8% Q HF %

    2 '3+1,5('3'1 )= % ? $!H8%HF F

    Como los bi$otes sobrepasan al valor m/nimo 76- @ al valor m10imo 44- delos datos, los bi$otes toman estos valores& 76 @ 44" Esto si$ni%ca ue no

    e0isten valores at/picos"

    El $r1%co apro0imado es el si$uiente

  • 7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx

    58/60

    GrficodeCa/a 23igotes

    %& && '& & )&

    peso45g

    GrficodeCa/a23i gotes

    6nter7alos deconfian8a del *&9para la mediana: ;'+++,% ,))*'