1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA

Click here to load reader

  • date post

    23-Jan-2016
  • Category

    Documents

  • view

    218
  • download

    0

Embed Size (px)

Transcript of 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA

  • *ESTADSTICADEPARTAMENTO DE MATEMTICA APLICADA

  • *TEMA 1: ESTADSTICA DESCRIPTIVA1.1 CONCEPTOS GENERALES.1.2 DISTRIBUCIN DE FRECUENCIAS.1.3 REPRESENTACIONES GRFICAS.1.4 MEDIDAS DE TENDENCIA CENTRAL.1.5 MEDIDAS DE DISPERSIN.1.6 MEDIDAS DE ASIMETRA.1.7 EL MODELO DE REGRESIN SIMPLE.

    PRCTICAS1. ESTADSTICA DESCRIPTIVA.2. MODELOS DE REGRESIN.

  • *PLANTEAMIENTO DEL PROBLEMAOBTENCIN DE LA MUESTRATRATAMIENTO DE LA INFORMACINPLANTEAMIENTO DEL MODELOESTIMACIN Y CONTRASTECRTICA DE RESULTADOSTEORA DE MUESTRASESTADSTICA DESCRIPTIVACLCULO DE PROBABILIDADESINFERENCIA ESTADSTICATOMA DE DECISIONES

  • *ESTADSTICA DESCRIPTIVATRATA DE DESCRIBIR CONJUNTOS DE DATOS RESUMIENDO LA INFORMACIN QUE ESTOS PROPORCIONAN, UTILIZANDO: TABLAS DE FRECUENCIASTCNICAS GRFICAS TCNICAS ANALTICAS: MEDIDAS DE POSICIN, DISPERSIN Y FORMA

  • *CONCEPTOS FUNDAMENTALES POBLACIN: conjunto de elementos o individuos de los que interesa estudiar alguna caracterstica. MUESTRA: subconjunto de elementos de una poblacin.RAZONES PARA ESTUDIAR UNA MUESTRA Coste Tiempo Personal cualificado Procesos destructivos

  • *Llamamos CARCTER a la cualidad objeto de nuestro estudio. Los caracteres pueden ser:Cuantitativos: la caracterstica toma valores numricos (nmero de peticiones a un servidor, tiempo entre peticiones consecutivas,etc)Cualitativos:la caracterstica no toma valores numricos (sexo, color de pelo, etc)

    Los caracteres cuantitativos se llaman VARIABLES ESTADSTICAS. Los caracteres cualitativos se llaman VARIABLES CUALITATIVAS. Las variables estadsticas pueden ser de dos tipos:Discretas: si la caracterstica toma valores aislados (finitos o infinito numerable). Continuas: si toma cualquier valor de uno o varios intervalos.

  • *1.2 DISTRIBUCIN DE FRECUENCIASSea una muestra de tamao n; supongamos que X toma como valores distintos x1, x2 ,..., xk .FRECUENCIA ABSOLUTA DE xi: Es el nmero, ni , de veces que se repite xi.FRECUENCIA RELATIVA DE xi: es el cociente entre la frecuencia absoluta y n.FRECUENCIA ABSOLUTA(RELATIVA) ACUMULADA DE xi. Si llamamos x*1, x*2 ,..., x*k a los valores ordenados de menor a mayor:Frecuencia absoluta acumulada de x*iFrecuencia relativa acumulada de x*i

  • *Se llama tabla o distribucin de frecuencias al conjunto de valores que toma la variable acompaados de sus respectivas frecuencias.

    Distribucin de frecuencias de la variable: n de llamadas recibidas en una centralita en perodos de un minuto

    xi

    Frecuencia

    Frec. relativa

    0

    40

    044

    1

    26

    029

    2

    14

    016

    3

    6

    007

    4

    3

    003

    5

    0

    000

    6

    1

    001

    Total

    90

    1

    Distribucin del motivo de compra de telfono mvil (1999)

    Caracterstica

    Frecuencia

    Frec. relativa

    Estar localizado

    47

    047

    Llamar a mi familia

    25

    025

    Hablar con mis clientes

    12

    012

    Slo en caso de emergencia

    11

    011

    Charlar con los amigos

    3

    003

    Enviar mensajes por pantalla

    2

    002

    Total

    100

    1

  • *Estas tablas son tiles para resumir la informacin de una variable cuando:El estudio est basado en pocas observaciones, a lo sumo 20El estudio est basado en muchas observaciones de una variable que toma pocos valores distintos, a lo sumo 20.Si el nmero de valores distintos que toma la variable es grande (mayor que 20), se agrupan los datos en intervalos para construir la tabla de frecuencias. Llamaremos a estas variables VARIABLES AGRUPADAS. Al resto nos referiremos como VARIABLES NO AGRUPADAS o sin agrupar.

  • *A estos intervalos se les llama intervalos de clase.Al punto medio de cada clase se le denomina marca de clase.El nmero de intervalos de clase lo determina la persona que est realizando el estudio, aunque una posibilidad razonable es tomar el entero ms prximo a 1+3.3log10(n).Si los valores que toma la variable estn repartidos de manera homognea, todos los intervalos se toman con la misma amplitud; en otro caso se tomarn intervalos de amplitud variable, procurando que no queden intervalos con menos del 5% de los datos ni con ms del 30%. VARIABLES AGRUPADAS EN INTERVALOS

  • *Los datos siguientes corresponden al consumo mensual de litros de leche de 40 familias:

    N=40, 1+33log40=629, luego tomamos 6 intervalos. Como R=1033-10=933 y 933:6=1555, podemos tomar 6 intervalos de amplitud 16 repartiendo el exceso (27) entre el primer intervalo y el ltimo. De este modo la agrupacin en intervalos quedara:Como podemos observar hay intervalos con menos del 5% de los datos y con ms del 30%, por lo que habra que optar por una agrupacin en intervalos de amplitud variable.

    10.1

    20.1

    60.3

    20.1

    40.3

    67.4

    21

    80

    10

    20

    40

    58

    58

    10

    20

    40

    10

    10

    20

    20

    10

    20

    10

    20

    85

    60

    43

    21.4

    22

    22

    42.8

    30

    40

    80.2

    72

    20

    42.7

    59.8

    103.3

    20.1

    [xi xi+1)

    ni

    [9,25)

    21

    [25,41)

    5

    [41,57)

    3

    [57,73)

    7

    [73,89)

    3

    [89,105]

    1

  • *Una posible agrupacin en intervalos de amplitud variable es la siguiente:

    Como puede observarse todos los intervalos contienen ms del 5% y menos del 30% de los datos.

    [xi xi+1)

    ni

    Amplitud

    [9,15)

    7

    6

    [15,21)

    10

    6

    [21,40)

    8

    19

    [40,59)

    6

    19

    [59,70)

    4

    11

    [70,105]

    5

    35

  • *1.3 MTODOS GRFICOSVARIABLES CUANTITATIVAS:Diagrama de barrasHistogramaPolgono de frecuenciasDiagrama de caja o box-plotDiagrama de sectoresVARIABLES CUALITATIVAS:Diagrama de rectngulosDiagrama de sectoresOTRAS REPRESENTACIONES.

  • *DIAGRAMA DE BARRAS

    Sobre cada valor de la variable se levanta una barra cuya altura es proporcional a su frecuencia (absoluta o relativa)La suma de las alturas de las barras es 90 porque hemos representado frecuencias absolutasNmero de llamadasfrecuencias0102030400123456

    NMERO DE LLAMADAS

    xi

    Frecuencia

    0

    40

    1

    26

    2

    14

    3

    6

    4

    3

    6

    1

    Total

    90

  • *HISTOGRAMACada clase se representa mediante un rectngulo cuyo rea es proporcional a su frecuencia (absoluta o relativa)La altura de cada rectngulo es el cociente entre el rea (frecuencia) y la base (amplitud del intervalo) o proporcional a dicho cociente

  • *22201816141210 8 6 4 2 10 20 30 40 50 60 70 80 90 100 110En el ejemplo del Consumo de litros de leche, si agrupamos en intervalos de la misma amplitud:

    [xi xi+1)

    ni

    [9,25)

    21

    [25,41)

    5

    [41,57)

    3

    [57,73)

    7

    [73,89)

    3

    [89,105]

    1

  • *Y si los intervalos son de amplitud variable, el histograma queda:2.22.01.81.61.41.21.00.80.60.40.2 10 20 30 40 50 60 70 80 90 100 110

    [xi xi+1)

    ni

    Amplitud

    [9,15)

    7

    6

    [15,21)

    10

    6

    [21,40)

    8

    19

    [40,59)

    6

    19

    [59,70)

    4

    11

    [70,105]

    5

    35

  • *POLGONO DE FRECUENCIASSi la variable es sin agrupar, el polgono de frecuencias se obtiene uniendo los extremos superiores de las barras en el diagrama de barrasNmero de llamadasfrecuencias0102030400123456

  • *POLGONO DE FRECUENCIASSi la variable est agrupada en intervalos, el polgono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de cada rectngulo2.22.01.81.61.41.21.00.80.60.40.2 10 20 30 40 50 60 70 80 90 100 110

  • *POLGONO DE FRECUENCIAS ACUMULADASSe obtiene levantando sobre el extremo superior de cada intervalo de clase una perpendicular al eje de abscisas cuya altura sea proporcional a la frecuencia acumulada (absoluta o relativa) del intervalo.

    Sobre el diagrama de barras que se forma se construye el polgono de frecuencias acumuladas partiendo del extremo inferior del primer intervalo y uniendo los extremos de las barras del diagrama de barras4.44.03.63.22.82.42.01.61.20.80.4 10 20 30 40 50 60 70 80 90 100 110

  • *DIAGRAMA DE SECTORESEl total de una caracterstica se representa en un crculo.El rea de cada sector circular representa el porcentaje sobre el total de cada categora.

  • *Cada categora o modalidad se representa por un rectngulo cuya altura es proporcional a su frecuencia. Todos los rectngulos tienen la misma base.Si se ordenan las categoras o clases por sus frecuencias (de mayor a menor frecuencia) se suele llamar a este grfico diagrama de Pareto

    DIAGRAMA DE RECTNGULOS

  • *

    0.5

    0.4

    0.3

    0.2

    0.1

    Localizado Familia Clientes Emergencias Amigos Mensajes

    Distribucin del Motivo de compra de telfono mvil

    Caracterstica

    Frecuencia

    Frec. relativa

    Estar localizado

    47

    047

    Llamar a mi familia

    25

    025

    Hablar con mis clientes

    12

    012

    Usar en ca