Tema 1. Estadística.

download Tema 1. Estadística.

of 70

Transcript of Tema 1. Estadística.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 1 de 39

    NDICE

    1. ESTADSTICA 3

    1.1. Definicin .................................................................................................................................................... 3

    1.2. Utilidad ....................................................................................................................................................... 3

    1.3. Campos de la estadstica ....................................................................................................................... 3

    1.4. Terminologa de un estudio estadstico ............................................................................................ 3

    1.5. Pasos que se dan en un estudio estadstico ..................................................................................... 4

    1.6. Tipos de variables estadsticas ........................................................................................................... 5

    2. TABLA DE FRECUENCIAS 5

    2.1. Utilidad ....................................................................................................................................................... 5

    2.2. Recuento de datos .................................................................................................................................. 5

    2.2.1. Definicin ..................................................................................................................................................... 5

    2.2.2. Construccin de una tabla de recuento de datos con datos aislados ............................................. 6

    2.2.3. Construccin de una tabla de recuento de datos con datos agrupados en intervalos ................ 6

    2.3. Construccin de una tabla de frecuencias ....................................................................................... 9

    2.4. Terminologa de una tabla de frecuencias ....................................................................................... 9

    2.5. Construccin de una tabla de frecuencias absoluta y relativa ................................................ 10

    2.5.1. Con datos aislados .................................................................................................................................... 10

    2.5.2. Con datos agrupados en intervalos ...................................................................................................... 11

    2.6. Construccin de una tabla de frecuencias absoluta y relativa acumuladas ......................... 12

    2.6.1. Con datos aislados .................................................................................................................................... 12

    2.6.2. Con datos agrupados en intervalos ...................................................................................................... 13

    3. GRFICOS ESTADSTICOS 13

    3.1. Utilidad ..................................................................................................................................................... 13

    3.2. Tipos de grficas estadsticas .......................................................................................................... 13

    3.2.1. Diagrama de barras ................................................................................................................................. 14

    3.2.2. Histograma ................................................................................................................................................ 14

    3.2.3. Polgono de frecuencias .......................................................................................................................... 15

    3.2.4. Diagrama de sectores ............................................................................................................................. 16

    3.2.5. Pictograma ................................................................................................................................................. 17

    3.2.6. Cartograma ................................................................................................................................................ 18

    3.2.7. Serie cronolgica ..................................................................................................................................... 18

    3.2.8. Pirmide de poblacin ............................................................................................................................. 19

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 2 de 39

    3.2.9. Resumen de grficas estadsticas ....................................................................................................... 19

    3.3. Ejemplos de grficas estadsticas .................................................................................................. 20

    3.4. Construccin de grficos estadsticos con datos aislados ....................................................... 21

    3.5. Construccin de grficos estadsticos con datos agrupados en intervalos ........................ 23

    4. PARMETROS ESTADSTICOS 24

    4.1. Utilidad .................................................................................................................................................... 24

    4.2. Tipos de parmetros estadsticos................................................................................................... 24

    4.2.1. Medidas de centralizacin ..................................................................................................................... 24

    4.2.1.1. Utilidad .............................................................................................................................................. 24

    4.2.1.2. Tipos ................................................................................................................................................... 24

    4.2.1.3. Con datos aislados ........................................................................................................................... 26

    4.2.1.4. Con datos agrupados en intervalos .............................................................................................. 29

    4.2.1.5. Resumen de medidas de centralizacin ...................................................................................... 30

    4.2.2. Medidas de posicin ................................................................................................................................ 31

    4.2.2.1. Utilidad ............................................................................................................................................... 31

    4.2.2.2. Tipos ................................................................................................................................................... 31

    4.2.2.3. Con datos aislados .......................................................................................................................... 34

    4.2.2.4. Con datos agrupados en intervalos ............................................................................................. 35

    4.2.2.5. Resumen de medidas de posicin ................................................................................................. 35

    4.2.3. Medidas de dispersin ........................................................................................................................... 37

    4.2.3.1. Utilidad .............................................................................................................................................. 37

    4.2.3.2. Tipos .................................................................................................................................................. 37

    4.2.3.3. Con datos aislados .......................................................................................................................... 38

    4.2.3.4. Con datos agrupados en intervalos ............................................................................................. 39

    4.2.3.5. Resumen de medidas de dispersin ............................................................................................ 39

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 3 de 39

    1. ESTADSTICA

    1.1. DEFINICIN

    La estadstica es la ciencia que estudia la forma de recopilar, ordenar y analizar datos.

    1.2. UTILIDAD

    La estadstica se ha convertido en un mtodo efectivo para describir y, sobre todo, para interpretar con exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar, analizar dichos datos y obtener conclusiones.

    1.3. CAMPOS DE LA ESTADSTICA

    Los tres temas que destacan en la estadstica son:

    Estadstica descriptiva: se ocupa del tratamiento sistemtico de sucesos ya acaecidos y su

    funcionalidad es recoger informacin, resumirla e interpretarla.

    Inferencia estadstica: generaliza a toda una poblacin, la informacin obtenida a partir del

    conocimiento de una muestra reducida.

    Clculo de probabilidades: se trata de una rama a caballo entre la estadstica descriptiva y la

    inferencia estadstica.

    1.4. TERMINOLOGA DE UN ESTUDIO ESTADSTICO

    Los trminos utilizados ms frecuentemente en los estudios estadsticos son:

    Poblacin: es el conjunto formado por todos los elementos del estudio estadstico.

    Muestra: es la parte de la poblacin que estudiamos y que nos sirve para deducir las

    caractersticas de la poblacin. La muestra se toma cuando la poblacin es muy grande y no

    puede realizarse un estudio de todos los individuos.

    Individuo: es cada uno de los elementos que forman la poblacin o la muestra.

    Tamao de la poblacin: es el nmero de individuos que componen una poblacin.

    Tamao de la muestra: es el nmero de individuos que componen una muestra.

    Variable estadstica: es cualquier cualidad que estudiamos en los individuos de la muestra o

    poblacin.

    Ejemplo: Los alumnos/as de 4 de ESO matriculados en Espaa son un total de 136.559. Para

    realizar un estudio estadstico sobre su peso, altura y edad, se seleccionan 300 alumnos/as de

    diferentes centros escolares.

    Poblacin: Los 136.559 alumnos/as matriculados.

    Muestra: 300 alumnos/as seleccionados de diferentes centros.

    Individuo: Cada alumno/a matriculado en 4 de ESO. 1 alumno/a.

    Tamao de la poblacin: 136.559 alumnos/as matriculados.

    Tamao de la muestra: 300 alumnos/as.

    Variables estadsticas: el peso, la altura y la edad.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 4 de 39

    Ejemplo: Se va a realizar un estudio estadstico sobre el porcentaje de personas casadas en

    una localidad de 122.594 habitantes. Para ello, se eligen 2.325 habitantes y se extienden las

    conclusiones a toda la poblacin.

    Poblacin: Los 122.594 habitantes de la localidad.

    Muestra: 2.325 habitantes elegidos aleatoriamente de la localidad.

    Individuo: Cada persona a la que se pregunta es un individuo de la muestra. Y cada habitante es un individuo de la poblacin. 1 habitante.

    Tamao de la poblacin: 122.594 habitantes.

    Tamao de la muestra: 2.325 personas.

    Variable estadstica: si una persona est casada o no.

    Ejemplo: Se quiere realizar una encuesta entre los alumnos/as de 3 de ESO de una ciudad, en

    total 6.578 alumnos/as. Para ello, se elige a los 63 alumnos/as de 3 de ESO del IES Cervantes.

    Determina la poblacin y la muestra.

    Poblacin: Todos los alumnos/as de 3 de ESO de la ciudad.

    Muestra: Los alumnos/as de 3 de ESO del IES Cervantes.

    Individuo: Cada alumno/a de 3 de ESO de la ciudad es un individuo de la poblacin. Y cada alumno/a de 3 de ESO del IES Cervantes es un individuo de la muestra. 1 alumno/a.

    Tamao de la poblacin: 6.578 alumnos/as.

    Tamao de la muestra: 63 alumnos/as.

    1.5. PASOS QUE SE DAN EN UN ESTUDIO ESTADSTICO

    En un proceso estadstico, se siguen los siguientes pasos:

    1. Elaboracin de la encuesta, de modo que el encuestado tenga claro lo que se le pregunta y

    cules son las posibles respuestas. Elegimos la poblacin que va a ser objeto del anlisis.

    Ejemplo: los habitantes de un pas.

    2. Recogida de datos. Es decir, se pasa la encuesta y se anotan las respuestas. La recogida de

    datos se suele realizar mediante encuestas o cuestionarios. Obtenemos los datos a partir de

    una muestra de individuos de la poblacin.

    3. Organizacin y clasificacin de las respuestas. El conjunto de los valores que vamos a

    estudiar se llama variable estadstica (ejemplos: estatura, color de ojos, nmero de zapatos,

    etc.).

    4. Elaboracin de tablas de frecuencias. Es decir, se elaboran tablas de frecuencias absolutas,

    relativas y porcentuales con el recuento de los resultados obtenidos en la encuesta.

    5. Confeccin de grficas estadsticas con los datos de la tabla de frecuencias.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 5 de 39

    1.6. TIPOS DE VARIABLES ESTADSTICAS

    Las variables estadsticas se clasifican segn los valores que pueden tomar.

    Ejemplos

    Tipos de

    variables

    Valor de la

    variable Variable Valores

    Cualitativas o atributos

    Cualidad Color preferido Blanco, rojo, azul,

    Sexo Hombre, mujer

    Cuantitativas

    Discretas Nmero N de libros ledos en un mes 0, 1, 2, 3,

    Nmero de pginas de un libro 210, 211, 22, 309,

    Continuas Infinitos nmeros Peso

    Entre 60 kg y 67 kg,

    Altura Entre 1,50 y 1,80,

    Las variables estadsticas tambin se pueden clasificar en:

    Variables unidimensionales: se tiene una nica variable. Estadstica unidimensional: recopila,

    ordena y analiza los datos de una variable. Ejemplo: Calcula el peso medio de la seleccin de

    Espaa.

    Variables bidimensionales: se tienen dos variables. Estadstica bidimensional: recopila,

    ordena y analiza los datos de dos variables. Ejemplo: Un jugador de Espaa que pesara 80 kg,

    qu edad tendra?

    Variables pluridimensionales: se tienen ms de dos variables. Estadstica pluridimensional:

    recopila, ordena y analiza los datos de ms de dos variables.

    2. TABLA DE FRECUENCIAS

    2.1. UTILIDAD

    Una vez que se han recogido los datos de una experiencia estadstica, hay que tabularlos, es

    decir, hay que construir con estos datos una tabla (tabla de frecuencias) en la cual se presentan de

    manera ordenada:

    Los valores de la variable que se est estudiando. variable estadstica

    El nmero de veces que aparece cada valor. Recuento de datos. frecuencia

    En los estudios estadsticos es necesario organizar los datos para poder trabajar con ellos y sacar conclusiones. Para ello, se utilizan las tablas de frecuencias y a partir de ellas se construyen

    diferentes representaciones grficas de esos datos.

    2.2. RECUENTO DE DATOS

    2.2.1. Definicin

    El recuento de datos se har segn sea el tipo de variable estadstica.

    Si la variable es cualitativa, se escribe cada valor (modalidad) y se anota el nmero de veces

    que aparece cada uno de ellos.

    Si la variable es cuantitativa discreta, se ordenan los valores en orden creciente y se anota el

    nmero de veces que aparece cada uno.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 6 de 39

    Y si la variable es cuantitativa continua, se ordenan los valores en intervalos o clases,

    usualmente de la misma amplitud, y como mnimo, 4 intervalos. Para facilitar los clculos, se toma el punto medio del intervalo, que se llama marca de clase.

    Las marcas de clase son los puntos medios de cada intervalo.

    El recuento de datos segn sean:

    Datos aislados:

    Variables cualitativas.

    Variables cuantitativas discretas. Se anota el nmero de veces que aparece cada dato.

    Datos agrupados en intervalos:

    Variables cuantitativas continuas. Se ordenan los valores en intervalos y se anota el

    nmero de veces que aparece cada dato.

    2.2.2. Construccin de una tabla de recuento de datos con datos aislados

    Ejemplo: Despus de preguntar a 40 alumnos/as sobre su deporte favorito, obtenemos estos

    resultados. Construye una tabla de frecuencias.

    F = ftbol T = tenis Bm = balonmano

    B = baloncesto A = atletismo

    Deporte favorito (Datos) Deporte favorito Recuento

    F F F B B T T Bm F 8

    A B B B Bm T A F B 12

    F B B Bm A Bm B B T 6

    F F T A A A A A A 10

    T A B B A F B T Bm 4

    Total 40

    El deporte favorito es una variable cualitativa.

    Ejemplo: Anotamos el nmero de hermanos que tienen los 50 alumnos/as de dos clases de 2 de

    ESO. Construye una tabla de frecuencias.

    N de hermanos (Datos) N de hermanos Recuento

    1 3 1 4 2 1 2 1 3 2 0 6

    2 1 3 1 0 2 3 2 1 1 1 16

    3 2 0 4 2 1 0 1 2 3 2 15

    1 1 4 2 1 3 1 2 3 2 3 10

    0 1 0 2 3 2 1 0 3 2 4 3

    Total 50

    El nmero de hermanos es una variable cuantitativa discreta.

    2.2.3. Construccin de una tabla de recuento de datos con datos agrupados en intervalos

    La distribucin de frecuencias agrupadas o tabla de frecuencias con datos agrupados se

    emplea si las variables cuantitativas discretas toman un nmero grande de valores o la variable es cuantitativa continua.

    Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

    Cada clase est delimitada por el lmite inferior de la clase (va con un corchete, significa que el nmero entra) y el lmite superior de la clase (va con un parntesis, significa que el nmero no entra).

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 7 de 39

    NOTA:

    En una tabla de frecuencias con datos agrupados en intervalos, hay libertad para elegir el nmero de clases y los extremos de las mismas (lmites inferior y superior de las clases).

    Se forman los intervalos, de modo que el lmite inferior del primero sea algo menor que el dato extremo inferior y el lmite superior del ltimo sea algo superior al dato extremo superior. Es

    deseable que los extremos de los intervalos no coincidan con ninguno de los datos. Para ello,

    conviene que los extremos de los intervalos tengan una cifra decimal ms que los datos.

    Cuando no nos dan la tabla de frecuencias con los datos agrupados en intervalos, los podemos agrupar en intervalos. Hay varias formas para calcular el nmero de intervalos, que son:

    1) Hallamos la raz cuadrada entera del nmero total de datos y, adems, no debe ser

    inferior a 6 ni superior a 15. O bien, el nmero de intervalos que tomaremos ser el

    redondeo hasta las unidades de N .

    2) Utilizamos la frmula emprica debida a Sturges: k = 1 + 3,3 log N

    Ejemplo: Como los valores extremos de una lista de 30 nmeros son 47,3 y 96,3, calcula el

    nmero de clases aconsejado para estos datos.

    N = 30

    1) 648,530

    2) Frmula de Sturges: k = 1 + 3,3 log 30 = 5,87 6

    La amplitud de la clase o la amplitud del intervalo es el tamao del intervalo.

    Si la amplitud del intervalo es un nmero grande, el nmero de intervalos es menor. Pero si la amplitud del intervalo es un nmero pequeo, el nmero de intervalos es mayor.

    Hay varias formas para calcular la amplitud del intervalo, que son:

    1) Conocido el nmero de intervalos, hallamos el nmero de elementos que tenemos entre el

    dato inferior y el dato mayor, esto es, el rango de elementos. Despus, dividimos el rango de elementos entre el nmero de intervalos y obtenemos la amplitud del intervalo.

    Rango = dato mayor dato menor

    Amplitud = rango / nmero de intervalos

    2) Conocido el nmero de intervalos, hallamos el nmero de elementos que tenemos entre el

    dato inferior y el dato mayor, esto es, el rango de elementos. Despus, tomamos el primer mltiplo del nmero de intervalos que sea mayor o igual que el rango de elementos. Por ltimo, dividimos el primer mltiplo del nmero de intervalos entre el nmero de intervalos y obtenemos la amplitud del intervalo.

    Rango = dato mayor dato menor

    pm = Primer mltiplo del nmero de intervalos rango

    Amplitud = pm / nmero de intervalos

    Ejemplo: Dada una lista de nmeros del 300 al 3.000, me piden que los agrupe en 7 intervalos,

    cul es la amplitud?

    Rango = 3.000 300 = 2.700

    Nmero de intervalos = 7

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 8 de 39

    Amplitud = 2.700 / 7 = 386

    Los intervalos son: 300 686 , 686 1.072 , 1.072 1.458 , 1.458 1.844 ,

    1.844 2.230 , 2.230 2.6216 , 2.616 3.002

    Ejemplo: Como los valores extremos de una lista de 40 nmeros son 149 y 178, calcula la

    amplitud.

    N = 40

    Rango = 178 149 = 29

    Nmero de intervalos = 632,640

    1) Amplitud = 29 / 6 = 4,83 5

    2) Primer mltiplo de 6 29 6 x 5 = 30 Amplitud = 5

    Los intervalos son: 148 153 , 153 158 , 158 163 , 163 168 , 168 173 , 173 178 ,

    178 183

    La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros estadsticos.

    Una vez que se calcula la primera marca de clase, las siguientes se obtienen de sumar a la

    marca de clase anterior la amplitud de la clase. marca de clase anterior + amplitud de la clase

    O tambin la marca de clase se podra calcular sumando al lmite inferior de la clase la mitad

    de la amplitud de la clase. lmite inferior de la clase + mitad de la amplitud de la clase

    Ejemplo: Construye la tabla de frecuencias del peso, en kg, de 20 alumnos/as.

    Peso (Datos) Peso Marca de clase Recuento

    66,5 59,2 60,1 64,2 70 [36, 42) 39 4

    52,2 50,3 42,2 61,9 52,4 [42, 48) 45 4

    50 41,6 47,9 42,8 55 [48, 54) 51 5

    49,2 41,6 38,7 36,5 45 [54, 60) 57 2

    [60, 66) 63 3

    [66, 72) 69 2

    Total 20

    El peso es una variable cuantitativa continua.

    Podemos ver que solo dos de los alumnos/as tienen el mismo peso (41,6 kg). Si con estos

    datos hacemos una tabla de frecuencias como la anterior, resultara muy poco ilustrativa (19 valores

    diferentes, los cuales tendran todos frecuencia 1 excepto el 41,6 que tendra frecuencia 2). Por eso,

    en casos como ste, es preferible hacer una tabla de frecuencias acumulando los datos en intervalos.

    La amplitud de la clase o la amplitud del intervalo se calcula como:

    Rango = 70 36,5 = 33,5

    Nmero de intervalos = 6

    Amplitud = 33,5 / 6 = 5,58 6

    Podemos tomar 6 intervalos de amplitud 6. amplitud = 6

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 9 de 39

    2.3. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS

    Para construir una tabla de frecuencias para variables cuantitativas (discretas o continuas), se

    colocan los datos ordenados, de menor a mayor, en la primera columna (variable estadstica), las

    frecuencias absolutas en la segunda y las frecuencias relativas en la tercera.

    Y en el caso de variables cualitativas, colocamos en la tabla aquellos valores que son

    independientes del lugar en que se pongan las modalidades.

    Distribucin de frecuencias

    ix if iF rif riF Porcentaje

    100rif (%)

    1x Valor 1 1f 1F N

    f1 N

    FFr

    11 1001 rf

    2x Valor 2 2f 2F N

    f 2 N

    FFr

    22 1002 rf

    3x Valor 3 3f 3F N

    f3 N

    FFr

    3

    3 1003 rf

    4x Valor 4 4f 4F N

    f 4 N

    FFr

    44 1004 rf

    nx Valor n nf nF N

    f n N

    FF nrn 100rnf

    Total N 1 100 %

    2.4. TERMINOLOGA DE UNA TABLA DE FRECUENCIAS

    Los trminos utilizados ms frecuentemente en una tabla de frecuencias son:

    X variable estadstica. Puede tomar n valores.

    ix valores que puede tomar la variable X.

    Para cada ix le corresponde un if , iF , rif y riF .

    if frecuencia absoluta de un dato, suceso o valor. Es el nmero de veces que se repite

    un valor iX . Nmero de individuos correspondiente a cada valor de la variable estadstica.

    n

    i

    ifN1

    suma de todas las if . Es el tamao del colectivo o de la poblacin o de la

    muestra. Total de individuos. Nmero total de elementos de la poblacin o de la muestra.

    i

    j

    ji fF1

    frecuencia acumulada absoluta (o frecuencia absoluta acumulada) de un dato.

    Es la suma de la frecuencia absoluta de ese dato con las frecuencias absolutas de todos los anteriores.

    N

    ff iri frecuencia relativa de un dato o suceso. Es el cociente entre la frecuencia

    absoluta y N.

    1i

    ri

    N

    f suma de todas las rif Representa la unidad. 100 %.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 10 de

    39

    N

    FF iri frecuencia acumulada relativa (o frecuencia relativa acumulada) de un dato. Es

    la suma de la frecuencia acumulada absoluta de ese dato con las frecuencias acumuladas absolutas de

    todos los anteriores.

    100rif (%) frecuencia porcentual de un dato. Es la frecuencia relativa de ese dato

    multiplicada por 100.

    100100 i

    rif suma de todas las 100rif Representa el 100 %.

    2.5. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS ABSOLUTA Y RELATIVA

    2.5.1. Con datos aislados

    Ejemplo: En el curso de 2 ESO, los deportes favoritos de los alumnos/as son:

    Deportes Ftbol Baloncesto Tenis Atletismo Balonmano

    Frecuencia 10 14 8 12 6

    Construye una tabla de frecuencias.

    Deportes

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    relativa

    rif

    Porcentaje

    100rif (%)

    Ftbol 10 20,050

    10 20 %

    Baloncesto 14 28,050

    14 28 %

    Tenis 8 16,050

    8 16 %

    Atletismo 12 24,050

    12 24 %

    Balonmano 6 12,050

    6 12 %

    Total N = 50 50

    501 100 %

    El deporte favorito es una variable cualitativa.

    65 f , 12,05 rf , 6 alumnos/as o el 12 % de los alumnos/as tiene como deporte

    favorito el balonmano.

    Ejemplo: Construye una tabla de frecuencias con la talla de calzado de 20 personas.

    43 42 41 39 41 38 40 43 44 40

    39 39 38 41 40 39 38 39 39 40

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 11 de 39

    Talla de

    calzado

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    relativa

    rif

    Porcentaje

    100rif (%)

    38 3 15,020

    3 15 %

    39 6 30,020

    6 30 %

    40 4 20,020

    4 20 %

    41 3 15,020

    3 15 %

    42 1 05,020

    1 5 %

    43 2 10,020

    2 10 %

    44 1 05,020

    1 5 %

    Total N = 20 20

    201 100 %

    La talla de calzado es una variable cuantitativa discreta.

    43 f , 20,03 rf , 4 personas o el 20 % de las personas tiene un 40 de talla de

    calzado.

    2.5.2. Con datos agrupados en intervalos

    Ejemplo: Obtn la tabla de las frecuencias de los pesos, en kg, de 20 alumnos/as.

    36,5 46,2 41,6 55 42,2 49,2 36,5

    59,2 46 47,9 52,2 55,9 36,6 45

    39,1 38 42,8 50,3 52,4 38,7

    Peso

    Marca

    de clase

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    relativa

    rif

    Porcentaje

    100riF (%)

    [35, 40) 37,5 6 30,020

    6 30 %

    [40, 45) 42,5 3 15,020

    3 45 %

    [45, 50) 47,5 5 25,020

    5 70 %

    [50, 55) 52,5 3 15,020

    3 85 %

    [55, 60) 57,5 3 15,020

    3 100 %

    Total N = 20 20

    201

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 12 de

    39

    El peso es una variable cuantitativa continua.

    La amplitud de la clase o la amplitud del intervalo se calcula como:

    Rango = 59,2 36,5 = 22,7

    Nmero de intervalos = 5

    Amplitud = 22,7 / 5 = 4,54 5

    Podemos tomar 5 intervalos de amplitud 5. amplitud = 5

    [35, 40) , 61 f , 30,01 rf , 6 alumnos/as o el 30 % de los alumnos/as pesan entre 35

    y 40 kg.

    2.6. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS ABSOLUTA Y RELATIVA ACUMULADAS

    Para construir una tabla de frecuencias para variables cuantitativas (discretas o continuas), se

    colocan los datos ordenados, de menor a mayor, en la primera columna (variable estadstica), las

    frecuencias absolutas en la segunda y las frecuencias relativas en la tercera.

    Y en el caso de variables cualitativas, colocamos en la tabla aquellos valores que son

    independientes del lugar en que se pongan las modalidades.

    2.6.1. Con datos aislados

    Ejemplo (continuacin): Construye una tabla de frecuencias acumuladas con la talla de calzado

    de 20 personas.

    43 42 41 39 41 38 40 43 44 40

    39 39 38 41 40 39 38 39 39 40

    Talla de

    calzado

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF

    Frecuencia

    relativa

    rif

    Frecuencia

    relativa

    acumulada

    riF

    Porcentaje

    100riF (%)

    38 3 3 15,020

    3 0,15 15 %

    39 6 9 30,020

    6 0,45 45 %

    40 4 13 20,020

    4 0,65 65 %

    41 3 16 15,020

    3 0,80 80 %

    42 1 17 05,020

    1 0,85 85 %

    43 2 19 10,020

    2 0,95 95 %

    44 1 20 05,020

    1 1 100 %

    Total N = 20 20

    201

    164 F , 80,04 rF , 16 personas o el 80 % de las personas tienen menos de un 41 de

    talla de calzado.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 13 de

    39

    2.6.2. Con datos agrupados en intervalos

    Ejemplo (continuacin): Obtn la tabla de las frecuencias acumuladas de los pesos, en kg, de 20

    alumnos/as.

    36,5 46,2 41,6 55 42,2 49,2 36,5

    59,2 46 47,9 52,2 55,9 36,6 45

    39,1 38 42,8 50,3 52,4 38,7

    Peso

    Marca

    de clase

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF

    Frecuencia

    relativa

    rif

    Frecuencia

    relativa

    acumulada

    riF

    Porcentaje

    100riF (%)

    [35, 40) 37,5 6 6 30,020

    6

    0,30 30 %

    [40, 45) 42,5 3 9 15,020

    3

    0,45 45 %

    [45, 50) 47,5 5 14 25,020

    5

    0,70 70 %

    [50, 55) 52,5 3 17 15,020

    3

    0,85 85 %

    [55, 60) 57,5 3 20 15,020

    3

    1 100 %

    Total N = 20 20

    201

    El peso es una variable cuantitativa continua.

    La amplitud de la clase o la amplitud del intervalo se calcula como:

    Rango = 59,2 36,5 = 22,7

    Nmero de intervalos = 5

    Amplitud = 22,7 / 5 = 4,54 5

    Podemos tomar 5 intervalos de amplitud 5. amplitud = 5

    [45, 50) , 53 F , 70,03 rF , 14 alumnos/as o el 70 % de los alumnos/as pesan menos

    de 50 kg.

    3. GRFICOS ESTADSTICOS

    3.1. UTILIDAD

    Las grficas estadsticas permiten visualizar la informacin contenida en las tablas de

    frecuencias de manera rpida y sencilla.

    Cada da en los telediarios o en los peridicos tienes ocasin de encontrar grficas. Y es que por

    medio de un grfico puedes representar muchos datos y ofrecer una visin ms global de todos ellos. A

    continuacin, vas a ver los ms usuales.

    3.2. TIPOS DE GRFICAS ESTADSTICAS

    Existen muchos tipos de grficas estadsticas. Unas se emplean con variables cuantitativas y

    otras con variables cualitativas.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 14 de

    39

    Pueden ser:

    Diagrama de barras.

    Histograma.

    Polgonos de frecuencias.

    Diagrama de sectores.

    Pictograma.

    Cartograma.

    Serie cronolgica.

    Pirmide de poblacin.

    3.2.1. Diagrama de barras

    El diagrama de barras se emplea para representar tablas de frecuencias de variables,

    cualitativas o cuantitativas (discretas), que tomen pocos valores. Est formado por barras cuya altura

    es proporcional a la frecuencia absoluta correspondiente.

    En el eje horizontal, representamos los valores de la variable, y en el eje vertical, las

    frecuencias absolutas.

    Ejemplo:

    Ejemplo:

    3.2.2. Histograma

    El histograma se emplea para representar variables cuantitativas (continuas) que tomen muchos

    valores. Est formado por rectngulos anchos que se adosan unos a otros.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 15 de

    39

    Ejemplo:

    Ejemplo:

    3.2.3. Polgono de frecuencias

    El polgono de frecuencias es una lnea poligonal que se construye uniendo los puntos medios de

    los lados superiores de las barras o de los rectngulos en un diagrama de barras o en un histograma. Se emplea para representar variables cualitativas o cuantitativas (discretas y continuas).

    Ejemplo:

    Ejemplo:

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 16 de

    39

    3.2.4. Diagrama de sectores

    El diagrama de sectores se emplea para representar variables de cualquier tipo, cualitativas o

    cuantitativas (discretas y continuas). La superficie total de un crculo se reparte en tantos sectores

    circulares como modalidades (valores) tiene la variable, correspondiente a cada sector un nmero de

    grados directamente.

    Los datos se representan en un crculo, dividido en sectores. Cada sector representa un valor

    de la variable. Y la amplitud de un sector, su ngulo, es proporcional a la frecuencia absoluta del dato

    que representa o a la frecuencia relativa.

    El ngulo del sector circular se obtiene aplicando la siguiente frmula:

    ngulo del sector circular: rii

    i fN

    ff

    N

    360

    360

    O aplicando la regla de 3 directa:

    N 360

    xf

    N

    i

    360 ;

    N

    fx i

    360

    if x

    En el diagrama de sectores, se escriben los valores de la variable y a veces el tanto por ciento

    que representa.

    Ejemplo:

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 17 de

    39

    Ejemplo:

    El grfico que representa las notas obtenidas en un examen sobre Estadstica que realiz un

    grupo de 3 de ESO.

    Esta representacin permite darse cuenta enseguida de muchas caractersticas de la

    distribucin de notas aunque no se conozcan exactamente los datos.

    Aqu se ve que suspendieron menos de la mitad del curso. Tambin que ms de la mitad obtuvo

    notas superiores a suficiente. Y que, exactamente, la cuarta parte fue puntuada con un bien.

    Ejemplo:

    3.2.5. Pictograma

    El pictograma es un grfico en el que se emplean figuras cuyas dimensiones son proporcionales

    al dato que representan, es decir, la imagen es proporcional a su frecuencia. La figura que se utiliza es

    un dibujo relacionado con el tema. Se emplea para representar variables cualitativas o cuantitativas

    (discretas y continuas).

    Ejemplo:

    En la figura ves que las longitudes de los lpices son proporcionales a las cantidades de dinero

    que quieren representar.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 18 de

    39

    3.2.6. Cartograma

    El cartograma es un grfico que se emplea cuando se realiza un estudio donde quieren

    manifestarse las diferencias entre regiones geogrficas. Representan variables geogrficas,

    econmicas, demogrficas, etc. Se trata de un mapa en el que por medio de colores o tramas se marcan

    los distintos valores de una cierta caracterstica. Se emplea para representar variables cualitativas o

    cuantitativas (discretas y continuas).

    Ejemplo:

    En este mapa se ha representado la renta familiar disponible en Espaa.

    Cada color indica un nivel de renta diferente. Con esta representacin percibimos de forma muy

    rpida multitud de informaciones, como:

    Andaluca y Murcia son las comunidades con menos ingresos por familia.

    Baleares presenta la mejor renta familiar del pas.

    Adems, podemos plantearnos las siguientes preguntas:

    Cul es la renta familiar en Melilla?

    Cul es la diferencia de renta familiar entre el Pas Vasco y Cantabria?

    Cul es la renta media de tu comunidad?

    3.2.7. Serie cronolgica

    La serie cronolgica se emplea cuando se quiere destacar la evolucin en el tiempo de cierto

    dato, que suele llamarse series temporales. Permiten comparar los cambios de una variable a travs del

    tiempo. Se emplea para representar variables cualitativas o cuantitativas (discretas y continuas).

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 19 de

    39

    Ejemplo: El valor de un euro en dlares ha sufrido muchas variaciones desde que se implant. Su

    evolucin durante 1999 puedes verla en el siguiente grfico.

    Observamos que su valor al comienzo del ao estaba en torno a los 1,13 dlares, que fue bajando

    durante el primer semestre hasta Julio, cuando se cambiaba por 1,02 dlares. Se recuper durante los

    meses de Agosto y Septiembre llegando a alcanzar el valor de 1,09 dlares. Pero el final del ao fue

    muy malo para nuestra moneda, el 13 de Diciembre tuvo el peor cambio del ao: 1 euro por 1,0128

    dlares.

    3.2.8. Pirmide de poblacin

    La pirmide de poblacin es muy utilizada en Economa, Geografa, Sociologa, etc. Se emplea

    para representar variables cualitativas o cuantitativas (discretas y continuas).

    Ejemplo: El concejal de cultura y deportes de un ayuntamiento present el siguiente grfico

    sobre las edades de los vecinos del pueblo que se hallaban inscritos en la Federacin de Ftbol.

    Observamos que, sin disponer de una excesiva cantidad de nmeros, seramos capaces de

    describir muchas caractersticas de ese conjunto de personas. As, interpretamos que la mayora son

    hombres, que el mayor nmero de federados se da entre los 10 y los 29 aos, que es raro encontrar

    personas con ms de 40 aos que tengan carnet de la Federacin de Ftbol, etc.

    3.2.9. Resumen de grficas estadsticas

    En la tabla siguiente, se presentan los tipos de grficas estadsticas con las variables

    estadsticas que se suelen usar.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 20 de

    39

    Tipos de grficas estadsticas Tipos de variables

    Diagrama de barras Variables cualitativas.

    Variables cuantitativas discretas.

    Histograma Variables cuantitativas continuas.

    Polgonos de frecuencias Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    Diagrama de sectores Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    Pictograma Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    Cartograma Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    Serie cronolgica Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    Pirmide de poblacin Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    3.3. EJEMPLOS DE GRFICAS ESTADSTICAS

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 21 de

    39

    3.4. CONSTRUCCIN DE GRFICOS ESTADSTICOS CON DATOS AISLADOS

    Ejemplo (continuacin): Representa los datos mediante un diagrama de barras, un polgono de

    frecuencias y un diagrama de sectores para los deportes favoritos de los alumnos/as.

    Diagrama de barras

    0

    2

    4

    6

    8

    10

    12

    14

    16

    Ftbol Baloncesto Tenis Atletismo Balonmano

    Deportes

    Fre

    cu

    en

    cia

    ab

    so

    luta

    Diagrama de barras y Polgono de frecuencias

    0

    2

    4

    6

    8

    10

    12

    14

    16

    Ftbol Baloncesto Tenis Atletismo Balonmano

    Deportes

    Fre

    cu

    en

    cia

    s a

    bso

    luta

    s

    Diagrama de sectores

    20%

    28%

    16%

    24%

    12%

    Ftbol

    Baloncesto

    Tenis

    Atletismo

    Balonmano

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 22 de

    39

    Ejemplo (continuacin): Representa los datos mediante un diagrama de barras, un polgono de

    frecuencias y un diagrama de sectores para la talla de calzado de 20 personas.

    Diagrama de barras

    0

    1

    2

    3

    4

    5

    6

    7

    38 39 40 41 42 43 44

    Talla de calzado

    Fre

    cu

    en

    cia

    ab

    so

    luta

    Diagrama de barras y Polgono de frecuencias

    0

    1

    2

    3

    4

    5

    6

    7

    38 39 40 41 42 43 44

    Talla de calzado

    Fre

    cu

    en

    cia

    ab

    so

    luta

    Diagrama de sectores

    15%

    30%

    20%

    15%

    5%

    10%5%

    38

    39

    40

    41

    42

    43

    44

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 23 de

    39

    3.5. CONSTRUCCIN DE GRFICOS ESTADSTICOS CON DATOS AGRUPADOS EN INTERVALOS

    Ejemplo (continuacin): Representa los datos mediante un histograma, un polgono de

    frecuencias y un diagrama de sectores para los pesos, en kg, de 20 alumnos/as.

    Histograma

    0

    1

    2

    3

    4

    5

    6

    7

    [35, 40) [40, 45) [45, 50) [50, 55) [55, 60)

    Peso (kg)

    Fre

    cu

    en

    cia

    ab

    so

    luta

    Histograma y Polgono de frecuencias

    0

    1

    2

    3

    4

    5

    6

    7

    [35, 40) [40, 45) [45, 50) [50, 55) [55, 60)

    Peso (kg)

    Fre

    cu

    en

    cia

    ab

    so

    luta

    Diagrama de sectores

    30%

    15%

    25%

    15%

    15%

    [35, 40)

    [40, 45)

    [45, 50)

    [50, 55)

    [55, 60)

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 24 de

    39

    4. PARMETROS ESTADSTICOS

    4.1. UTILIDAD

    Las variables cuantitativas se pueden resumir mediante las medidas estadsticas o parmetros estadsticos.

    Por tanto, los parmetros estadsticos son nmeros que resumen datos.

    4.2. TIPOS DE PARMETROS ESTADSTICOS

    Pueden ser de tres tipos:

    Medidas de centralizacin.

    Medidas de posicin.

    Medidas de dispersin.

    4.2.1. Medidas de centralizacin

    4.2.1.1. Utilidad

    Las medidas de centralizacin nos permiten conocer el valor alrededor del cual se agrupan

    todos los datos. Se utilizan para resumir la informacin de la muestra.

    4.2.1.2. Tipos

    Las ms utilizadas son la media aritmtica, la mediana y la moda.

    Media aritmtica: es el cociente de la suma de todos los valores y el nmero de datos. Es la

    suma de todos los datos divididos por el nmero total de datos. Se denota por x .

    Cuando el nmero de datos es grande, la media aritmtica se obtiene a partir de la

    tabla de frecuencias absolutas y se calcula como:

    N

    fx

    f

    fx

    ff

    fxfxx

    n

    i

    ii

    n

    i

    i

    n

    i

    ii

    n

    nn

    1

    1

    1

    1

    11

    ......

    ......

    La media de una distribucin representa el centro de gravedad de los datos.

    Esta medida es nica y puede no coincidir con ninguno de los datos de estudio. Slo se

    puede calcular para variables cuantitativas (discretas y continuas).

    En las variables cuantitativas continuas, tomamos como valor ix la marca de clase de

    cada intervalo.

    Mediana: es el valor ix de la variable que ocupa el lugar central cuando se ordenan los datos. Es

    el valor que ocupa la posicin central una vez ordenados los datos, de menor a mayor. Se denota

    por Me.

    Para calcular la mediana, ordenamos los datos de menor a mayor.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 25 de

    39

    Si el nmero de datos es impar, la mediana es el valor que ocupa el lugar central.

    1 cxMe donde c el cociente entero que resulta al dividir N entre 2, y c+1

    es el valor de la variable que ocupa el lugar c+1.

    Y si el nmero de datos es par, la mediana es el promedio de los dos valores centrales.

    2

    1 ccxx

    Me

    Otra forma de calcular, es observando la frecuencia absoluta acumulada iF . Para ello,

    tomamos aquel valor de la variable ix cuyo primer valor de la variable iF sea mayor o igual que

    2

    N. En resumen,

    Buscamos la primera 2

    NFi que es ii xMenF

    Esta medida es nica y puede no coincidir con ninguno de los datos de estudio. Slo se

    puede calcular para variables cuantitativas (discretas y continuas).

    En las variables cuantitativas continuas, tomamos como valor ix la clase mediana o

    intervalo mediana, que corresponde al intervalo que contiene al valor central si N es impar y a los dos valores centrales si N es par. Luego, el valor aproximado de la clase mediana ser la

    marca de clase del intervalo. Para calcular el valor exacto, usamos la frmula siguiente:

    i

    i

    if

    FN

    cLMe1

    2

    Donde, iL es el lmite inferior de la clase mediana, c es la amplitud de los intervalos,

    N es nmero total de datos, 1iF es la frecuencia absoluta acumulada de la clase anterior a la

    clase mediana y if es la frecuencia absoluta de la clase mediana.

    Moda: es el valor ix de mayor frecuencia absoluta. Es el valor de la variable con ms

    frecuencia. Un conjunto de datos puede tener una moda o ms de una. Se denota por Mo. En

    resumen,

    Buscamos la if mayor ixMo

    Cuando existen 2 valores con mxima frecuencia absoluta, se llama bimodal; con 3

    valores, se llama trimodal, etc. As cuando existen varias modas, se llama multimodal.

    Esta medida puede no ser nica y coincide siempre con alguno de los datos de estudio.

    Se puede calcular para variables de cualquier tipo, cualitativas o cuantitativas (discretas y

    continuas).

    En un diagrama de barras, la moda es el dato correspondiente a la barra de mayor

    altura.

    Y en un diagrama de sectores, la moda es el dato correspondiente al sector de mayor

    amplitud.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 26 de

    39

    En las variables cuantitativas continuas, tomamos como valor ix la clase modal o

    intervalo modal, que corresponde al intervalo de mayor frecuencia absoluta. Luego, el valor

    aproximado de la clase modal ser la marca de clase del intervalo. Para calcular el valor exacto, usamos la frmula siguiente:

    21

    1

    DD

    DcLMo i

    Donde, iL es el lmite inferior de la clase mediana, c es la amplitud de los intervalos,

    1D es la diferencia entre la frecuencia absoluta de la clase modal if y la de la clase anterior

    1if , y 2D es la diferencia entre la frecuencia absoluta de la clase modal if y la de la clase

    siguiente 1if .

    4.2.1.3. Con datos aislados

    A continuacin, presentamos varios ejemplos para variables cuantitativas discretas.

    Ejemplo (continuacin). Datos pares: Calcula las medidas de centralizacin para la talla de

    calzado de 20 personas.

    Talla de

    calzado

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF

    ii fx

    38 3 3 114

    39 6 9 234

    40 4 13 160

    41 3 16 123

    42 1 17 42

    43 2 19 86

    44 1 20 44

    Total N = 20 803

    Media aritmtica: 15,4020

    803x

    Con este dato podemos deducir que la talla de calzado normal perteneciente a este

    grupo de personas es 40.

    Mediana: Hay dos formas:

    1) Ordenamos los datos de menor a mayor.

    38 38 38 39 39 39 39 39 39 40 40 40 40 41 41 41 42 43 43 44

    102

    20

    2

    N

    Como N = 20 es par, cogemos los dos valores centrales 40 y 40 y calculamos la media de

    estos dos: 402

    80

    2

    4040

    .

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 27 de

    39

    2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a

    102

    20

    2

    N. Por lo que es 133 F , que se corresponde con la talla de calzado 40.

    Me = 40 porque la talla de calzado es 40, que es el valor central.

    Con este dato podemos deducir que el valor central para la talla de calzado

    perteneciente a este grupo de personas es 40.

    Moda: Mo = 39 porque la frecuencia absoluta mayor es 62 f (es el valor que ms se repite).

    Con este dato podemos deducir que la talla de calzado ms usada por este grupo de

    personas es 39.

    Ejemplo. Datos impares: Calcula las medidas de centralizacin para el nmero de hermanos/as

    de 7 personas.

    1 3 2 4 3 2 3

    N de

    hermanos/as

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF

    ii fx

    1 1 1 1

    2 2 3 4

    3 3 6 9

    4 1 7 4

    Total N = 7 18

    Media aritmtica: 57,27

    18x

    Con este dato podemos deducir que el nmero de hermanos normal perteneciente a

    este grupo de personas es 3.

    Mediana: Hay dos formas:

    1) Ordenamos los datos de menor a mayor.

    1 2 2 3 3 3 4

    5,32

    7

    2

    N

    Como N = 7 es impar, cogemos el valor central 3.

    2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a

    5,32

    7

    2

    N. Por lo que es 63 F , que se corresponde con el nmero de hermanos 3.

    Me = 3 porque el nmero de hermanos es 3, que es el valor central.

    Con este dato podemos deducir que el valor central para el nmero de hermanos

    perteneciente a este grupo de personas es 3.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 28 de

    39

    Moda: Mo = 3 porque la frecuencia absoluta mayor es 33 f (es el valor que ms se repite).

    Con este dato podemos deducir que el nmero de hermanos ms usado por este grupo de

    personas es 3.

    Ejemplo. Datos pares: La siguiente tabla resume los resultados obtenidos en una encuesta

    realizada entre 10 parejas a las que se les preguntaba sobre el nmero de hijos que tenan. Calcula las

    medidas de centralizacin e interprtalas.

    N de

    hijos/as

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF

    ii fx

    0 2 2 0

    1 4 6 4

    2 3 9 6

    3 1 10 3

    Total N = 10 13

    Media aritmtica: 3,110

    13x

    Con este dato podemos deducir que por trmino medio las parejas tienen entre 1 y 2

    hijos/as.

    Mediana: Hay dos formas:

    1) Ordenamos los datos de menor a mayor.

    0 0 1 1 1 1 2 2 2 3

    52

    10

    2

    N

    Como N = 10 es par, cogemos los dos valores centrales 1 y 1 y calculamos la media de

    estos dos: 12

    2

    2

    11

    .

    2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a

    52

    10

    2

    N. Por lo que es 62 F , que se corresponde con el nmero de hijos/as 1.

    Me = 1 porque el nmero de hijos/as es 1, que es el valor central.

    Con este dato podemos deducir que el valor central para el nmero de hijos/as

    perteneciente a este grupo de personas es 1. Esto es, la mediana indica que hay tantas parejas

    que tienen 1 ms hijos/as como parejas que tienen 1 hijo/a o menos.

    Moda: Mo = 1 porque la frecuencia absoluta mayor es 42 f (es el valor que ms se repite).

    Con este dato podemos deducir que lo ms frecuente es tener 1 hijo.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 29 de

    39

    4.2.1.4. Con datos agrupados en intervalos

    A continuacin, presentamos varios ejemplos para variables cuantitativas continuas.

    Ejemplo (continuacin). Datos pares: Calcula las medidas de centralizacin para los pesos, en

    kg, de 20 alumnos/as.

    Peso

    Marca

    de clase

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF

    ii fx

    [35, 40) 37,5 6 6 225

    [40, 45) 42,5 3 9 127,5

    [45, 50) 47,5 5 14 237,5

    [50, 55) 52,5 3 17 157,5

    [55, 60) 57,5 3 20 172,5

    Total N = 20 920

    Media aritmtica: 4620

    920x

    Con este dato podemos deducir que el peso normal perteneciente a este grupo de

    alumnos/as es 46 kg.

    Mediana: Hay dos formas:

    1) Ordenamos los datos de menor a mayor.

    36,5 36,5 36,6 38 38,7 39,1 41,6 42,2 42,8 45

    46 46,2 47,9 49,2 50,3 52,2 52,4 55 55,9 59,2

    102

    20

    2

    N

    Como N = 20 es par, cogemos los dos valores centrales 45 y 46 y calculamos la media de

    estos dos: 5,452

    91

    2

    4645

    2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a

    102

    20

    2

    N. Por lo que es 143 F , que se corresponde con el peso entre 45 y 50 kg.

    Me = [45, 50)

    Luego, el valor aproximado de la clase mediana es Me = 47,5.

    Para calcular el valor exacto, usamos la frmula siguiente:

    461455

    910545

    Me

    Con este dato podemos deducir que el valor central para el peso perteneciente a este

    grupo de alumnos/as es 46 kg.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 30 de

    39

    Moda: Mo = [45, 50) porque la frecuencia absoluta mayor es 53 f (es el valor que ms se

    repite).

    Con este dato podemos deducir que el peso ms usado por este grupo de alumnos/as

    est entre 45 y 50 kg.

    Luego, el valor aproximado de la clase modal es Mo = 47,5.

    Para calcular el valor exacto, usamos la frmula siguiente:

    45

    2

    90

    2

    545

    4

    2545

    3535

    35545

    Mo

    4.2.1.5. Resumen de medidas de centralizacin

    En la tabla siguiente, se presentan los tipos de medidas de centralizacin con las variables

    estadsticas que se suelen usar.

    Tipos de medidas de centralizacin Tipos de variables

    Media aritmtica Variables cuantitativas discretas y continuas.

    Mediana Variables cuantitativas discretas y continuas.

    Moda Variables cualitativas.

    Variables cuantitativas discretas y continuas.

    En la tabla siguiente, se presenta un resumen de los tipos de medidas de centralizacin.

    Tipos Cmo se calcula Variables cuantitativas continuas

    Media aritmtica

    N

    fx

    x

    n

    i

    ii

    1 ix marca de clase de cada intervalo.

    Mediana

    1) Ordenamos los datos de menor

    a mayor.

    Si N es impar 1 cxMe

    Si N es par 2

    1 ccxx

    Me

    Donde: 2

    Nc

    2) Buscamos la primera 2

    NFi

    que es ii xMenF

    ),[ 1 iii LLxMe clase mediana o

    intervalo mediana.

    Valor aproximado Me = marca de clase

    del intervalo.

    Valor exacto i

    i

    if

    FN

    cLMe1

    2

    Donde:

    iL lmite inferior.

    c amplitud de los intervalos.

    1iF frecuencia absoluta acumulada de

    la clase anterior.

    if frecuencia absoluta.

    Moda Buscamos la if mayor ixMo

    ),[ 1 iii LLxMo clase modal o

    intervalo modal.

    Valor aproximado marca de clase del

    intervalo.

    Valor exacto

    111

    iiii

    ii

    iffff

    ffcLMo

    Donde:

    iL lmite inferior.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 31 de

    39

    c amplitud de los intervalos.

    4.2.2. Medidas de posicin

    4.2.2.1. Utilidad

    Las medidas de posicin dividen un conjunto ordenado de datos en grupos con la misma

    cantidad de individuos.

    Las medidas de posicin son valores de la variable que informan del lugar que ocupa un dato

    dentro del conjunto ordenado de valores.

    Slo se puede calcular para variables cuantitativas (discretas y continuas).

    4.2.2.2. Tipos

    Las ms utilizadas son los cuartiles, los deciles y los percentiles.

    Cuartiles: son tres valores Q1, Q2 y Q3 de la variable estadstica que dividen a los individuos de la poblacin en cuatro partes iguales, es decir, en cada tramo est el 25 % de los datos recogidos en el estudio. Los cuartiles son los puntos de separacin.

    25 % 25 % 25 % 25 %

    Q1 Q2 Q3

    N

    44:

    kNk

    NQk con K = 1, 2, 3

    Buscamos la primera kN

    Fi 4

    que es iki xQnF

    - Primer cuartil Q1: es el valor de la variable que deja la cuarta parte de las observaciones menores o iguales a l y las tres cuartas partes superiores a l. Es decir, deja por debajo de l al 25 % de la poblacin y por encima al 75 %.

    14

    :4

    125,0%25: 11

    NQNNNQ

    Buscamos la primera 14

    NFi que es ii xQnF 1

    - Segundo cuartil Q2: es el valor de la variable que deja las dos cuartas partes inferiores o iguales a l, es decir, la mitad de las observaciones. Este cuartil coincide con la mediana.

    24

    :2

    150,0%50: 22

    NQNNNQ

    Buscamos la primera 24

    NFi que es ii xQnF 2

    - Tercer cuartil Q3: es el valor de la variable que deja las tres cuartas partes de las observaciones inferiores o iguales a l y la cuarta parte de stas superior a l. Es decir, deja por debajo de l al 75 % de la poblacin y por encima al 25 %.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 32 de

    39

    34

    :4

    375,0%75: 33

    NQNNNQ

    Buscamos la primera 34

    NFi que es ii xQnF 3

    - Recorrido intercuartlico RIQ: es la diferencia entre el tercer y el primer cuartil de una

    distribucin.

    13 QQRIQ

    As pues,

    Q1 25 %

    Q2 = Me 50 %

    Q3 75 %

    Deciles: son 9 valores de la variable estadstica que dividen a los individuos de la poblacin en 10 partes iguales.

    Decil k (Dk) es el valor de la variable estadstica que deja k observaciones por debajo.

    10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 %

    D1 D2 D3 D4 D5 D6 D7 D8 D9

    N

    kN

    DNk

    NkD kk 10

    :10

    %:

    Buscamos la primera kN

    Fi 100

    que es iki xPnF

    As pues,

    D1 10 %

    D2 20 %

    D5 = Q2 = Me 50 %

    D9 90 %

    Percentiles: son 99 valores de la variable estadstica que dividen a los individuos de la poblacin en 100 partes iguales.

    Percentil k (Pk) es el valor de la variable estadstica que deja k observaciones por debajo. Tambin se denomina centil K.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 33 de

    39

    1 % 1 % 1 %

    P1 P2 P30 P50 P80 P90 P99

    N

    kN

    PNk

    NkP kk 100

    :100

    %:

    Buscamos la primera kN

    Fi 100

    que es iki xPnF

    Los percentiles ms usados son:

    - Percentil 15 (P15) deja por debajo al 15 % de las observaciones y por encima al 85 %.

    15100

    :100

    1515,0%15: 1515

    NPNNNP

    Buscamos la primera 15100

    N

    Fi que es ii xPnF 15

    - Percentil 50 (P50) es la mediana y el segundo cuartil Q2, que deja por debajo al 50 % de las

    observaciones y por encima al 50 %.

    - Percentil 25 (P25) es el primer cuartil Q1, que deja por debajo al 25 % de las observaciones

    y por encima al 75 %.

    - Percentil 75 (P75) es el tercer cuartil Q3, que deja por debajo al 75 % de las observaciones

    y por encima al 25 %.

    As pues,

    Q1 = P25 25 %

    Q2 = D5 = P50 = Me 50 %

    Q3 = P75 75 %

    D1 = P10 10 %

    D2 = P20 20 %

    D9 = P90 90 %

    P1 1 %

    P2 2 %

    P30 30 %

    P99 99 %

    NOTA:

    Cuando se calculan los cuartiles, percentiles y deciles, hay que tener en cuenta si el nmero de

    datos es impar o par.

    Si el nmero de datos es impar, el cuartil, percentil y decil es el valor que ocupa el lugar

    central.

    13,2,1 cxQ , 199,...,3,2,1 cxP , 190,...,30,20,10 cxD donde c el cociente entero que

    resulta al dividir N entre 2, y c+1 es el valor de la variable que ocupa el lugar c+1.

    Y si el nmero de datos es par, el cuartil, percentil y decil es el promedio de los dos valores

    centrales.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 34 de

    39

    2

    1

    3,2,1

    ccxx

    Q , 2

    1

    99,...,3,2,1

    ccxx

    P , 2

    1

    90,...,30,20,10

    ccxx

    D

    Otra forma de calcular los cuartiles, los deciles y los percentiles, es cuando los datos vienen

    datos en una tabla de frecuencias, pues se necesita la columna de la frecuencia absoluta acumulada iF .

    Tomamos aquel valor de la variable ix cuyo primer valor de la variable iF sea mayor o igual que

    el cuartil o el percentil pedido.

    4.2.2.3. Con datos aislados

    A continuacin, presentamos varios ejemplos para variables cuantitativas discretas.

    Ejemplo: Para comprar zapatillas a los miembros de una pea de bolos, se les ha preguntado por

    la talla de calzado que usan y los resultados se presentan en esta tabla. Calcula las medidas de posicin.

    Talla de

    calzado

    ix

    Frecuencia

    absoluta

    if

    Frecuencia

    absoluta

    acumulada

    iF 35 7 7

    36 13 20

    37 20 40

    38 37 77

    39 42 119

    40 50 169

    41 23 192

    42 8 200

    Total N = 200

    Para calcular el primer cuartil Q1 , tendremos que calcular el 25 % del nmero total de datos,

    200 200 0,25 = 50

    Luego, Q1 tiene 50 datos por debajo y el resto por encima. En la columna de frecuencias

    absolutas acumuladas, el primer nmero mayor o igual que 50 es 77, que corresponde al dato 38. Por

    tanto, Q1 = 38 Es decir, la cuarta parte de los miembros de la pea utilizan una talla de calzado menor

    o igual que 38.

    50:14

    200:200

    4

    120025,0200%25: 111 QQQ

    Buscamos la primera 50iF que es 3877 1414 QxQF

    El segundo cuartil Q2 , tiene el 50 % de los datos por debajo y el 50 % por encima. Es decir,

    coincide con la mediana. Tendremos que calcular el 50 % del nmero total de datos, 200

    200 0,50 = 100

    Como el primer nmero mayor o igual que 100 en las frecuencias absolutas acumuladas es 119,

    entonces Q2 = 39 Es decir, la mitad de los miembros de la pea utilizan una talla de calzado menor o

    igual que 39.

    100:24

    200:200

    2

    120050,0200%50: 222 QQQ

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 35 de

    39

    Buscamos la primera 100iF que es 39119 2525 QxQF

    Y el tercer cuartil Q3 , tiene el 75 % de los datos por debajo y el 25 % por encima, tendremos

    que calcular el 75 % del nmero total de datos, 200 200 0,75 = 150

    Como el primer nmero mayor o igual que 150 en las frecuencias absolutas acumuladas es 169,

    entonces Q3 = 40 Es decir, las dos terceras partes de los miembros de la pea utilizan una talla de

    calzado menor o igual que 40.

    150:34

    200:200

    4

    320075,0200%75: 333 QQQ

    Buscamos la primera 150iF que es 40169 3636 QxQF

    Para calcular los percentiles, se hara lo mismo:

    P15 tiene el 15 % de los datos por debajo y el 85 % por encima, tendremos que calcular

    el 15 % del nmero total de datos, 200 200 0,15 = 30

    Luego, P15 tiene 30 datos por debajo y el resto por encima. En la columna de frecuencias

    absolutas acumuladas, el primer nmero mayor o igual que 30 es 40, que corresponde al dato 37. Por

    tanto, P15 = 37 Es decir, el 15 % de los miembros de la pea utilizan una talla de calzado menor o igual

    que 37.

    30:15100

    200:200

    100

    1520015,0200%15: 151515 PPP

    Buscamos la primera 30iF que es 3740 153153 PxPF

    En resumen,

    P25 = Q1 = 38

    P50 = D5 = Q2 = Me = 39

    P75 = Q3= 40

    4.2.2.4. Con datos agrupados en intervalos

    A continuacin, presentamos varios ejemplos para variables cuantitativas continuas.

    4.2.2.5. Resumen de medidas de posicin

    En la tabla siguiente, se presentan los tipos de medidas de posicin con las variables

    estadsticas que se suelen usar.

    Tipos de medidas de posicin Tipos de variables

    Primer cuartil Q1 Variables cuantitativas discretas y continuas.

    Segundo cuartil Q2 Variables cuantitativas discretas y continuas.

    Tercer cuartil Q3 Variables cuantitativas discretas y continuas.

    Decil k (Dk) Variables cuantitativas discretas y continuas.

    Percentil k (Pk) Variables cuantitativas discretas y continuas.

    En la tabla siguiente, se presenta un resumen de los tipos de medidas de posicin.

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 36 de

    39

    Tipos Cmo se calcula Variables cuantitativas

    continuas

    Primer cuartil

    Q1

    14

    :4

    125,0%25: 11

    NQNNNQ

    Buscamos la primera 14

    NFi que es

    ii xQnF 1

    ),[ 11 iii LLxQ

    Valor aproximado 1Q =

    marca de clase del

    intervalo.

    Valor exacto

    i

    i

    if

    FN

    cLQ1

    14

    1

    Segundo cuartil

    Q2 = Me

    24

    :2

    150,0%50: 22

    NQNNNQ

    Buscamos la primera 24

    NFi que es

    ii xQnF 2

    ),[ 12 iii LLxQ

    Valor aproximado 2Q =

    marca de clase del

    intervalo.

    Valor exacto

    i

    i

    if

    FN

    cLQ1

    24

    2

    Tercer cuartil

    Q3

    34

    :4

    375,0%75: 33

    NQNNNQ

    Buscamos la primera 34

    NFi que es

    ii xQnF 3

    ),[ 13 iii LLxQ

    Valor aproximado 3Q =

    marca de clase del

    intervalo.

    Valor exacto

    i

    i

    if

    FN

    cLQ1

    34

    3

    Recorrido intercuartlico

    RIQ 13 QQRIQ

    Decil k Dk

    kN

    DNk

    NkD kk 10

    :10

    %:

    Buscamos la primera kN

    Fi 100

    que es

    iki xPnF

    ),[ 1 iiik LLxD

    Valor aproximado kD =

    marca de clase del

    intervalo.

    Valor exacto

    i

    i

    ikf

    FN

    k

    cLD1

    10

    Percentil k Pk

    kN

    PNk

    NkP kk 100

    :100

    %:

    Buscamos la primera kN

    Fi 100

    que es

    iki xPnF

    ),[ 1 iiik LLxP

    Valor aproximado kP =

    marca de clase del

    intervalo.

    Valor exacto

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 37 de

    39

    i

    i

    ikf

    FN

    k

    cLP1

    100

    4.2.3. Medidas de dispersin

    4.2.3.1. Utilidad

    Dos distribuciones pueden tener las mismas medidas de centralizacin y ser muy diferentes si

    los valores de las variables se distribuyen o dispersan de forma diferente.

    Las medidas de dispersin pretenden medir lo agrupados que se encuentran los datos en torno

    a la media aritmtica. Es decir, se utilizan para conocer en qu medida los datos de una muestra se

    encuentran ms o menos alejados de su media.

    Las medidas de dispersin permiten conocer el grado de agrupamiento de los datos en torno a

    las medidas de centralizacin, fundamentalmente, la media aritmtica.

    4.2.3.2. Tipos

    Las ms utilizadas son el rango, la desviacin media, la varianza, la desviacin tpica y el

    coeficiente de variacin.

    Rango o recorrido: es la diferencia entre el mayor y el menor valor de la variable ix . Indica el

    grado de dispersin de los datos. Se denota por R.

    1xxR n

    Cuanto mayor es el rango, ms dispersos estn los datos.

    Desviacin media: es la media aritmtica de los valores absolutos de las desviaciones de cada

    dato. Se halla calculando el promedio de todas las diferencias de los valores con la media.

    N

    fxx

    f

    fxx

    DM

    n

    i

    ii

    n

    i

    i

    n

    i

    ii

    1

    1

    1

    Es el promedio de las desviaciones a la media. Indica el grado de dispersin (alejamiento) de los datos respecto a su media.

    Varianza: es la media aritmtica de los cuadrados de las desviaciones respecto a la media. Se

    denota por 2 .

    21

    2

    2

    1

    1

    2

    2

    1

    2

    1

    2

    12

    ......

    ......x

    N

    fx

    x

    f

    fx

    xff

    fxfx

    n

    i

    ii

    n

    i

    i

    n

    i

    ii

    n

    nn

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 38 de

    39

    Desviacin tpica: es la raz cuadrada de la varianza. Se denota por .

    2

    Mide el grado de dispersin. Dice cmo de alejados de la media, cmo de dispersos, se

    encuentran los datos.

    Coeficiente de variacin: es el cociente de la desviacin tpica y la media aritmtica. Se

    denota por CV.

    xCV

    Se suele dar en porcentajes e indica la variacin relativa.

    NOTA:

    En las variables cuantitativas continuas, tomamos como valor ix la marca de clase de cada

    intervalo.

    Para comparar la dispersin de dos poblaciones heterogneas (con distinta media aritmtica), se

    utiliza el coeficiente de variacin, pues indica la variacin relativa.

    Cuando dos distribuciones tienen la misma media, la diferencia entre ambas viene dada a travs

    de la desviacin tpica, que nos indica lo alejados que se encuentran los datos con respecto de la

    media aritmtica.

    La varianza y la desviacin tpica de una distribucin son siempre positivas o nulas. Es nula

    cuando todos los datos son iguales a la media.

    Cuanto menor es la varianza o la desviacin tpica, mayor es el grado de representatividad de

    los valores centrales.

    Cuando la desviacin tpica toma valores mayores que uno, hay bastante dispersin.

    Si las medidas de dispersin son pequeas, se puede concluir que los datos estn agrupados

    alrededor de la media aritmtica. Es decir, cuanto menores son las medidas de dispersin, ms

    concentrados estn los datos.

    Y si las medidas de dispersin son grandes, significa que los datos estn bastante dispersos.

    4.2.3.3. Con datos aislados

    A continuacin, presentamos varios ejemplos para variables cuantitativas discretas.

    Ejemplo: Calcula las medidas de dispersin del grupo para las notas de 5 alumnos/as de 3 ESO.

    1 1 5 9 9

    Notas de

    alumnos/as

    ix

    Frecuencia

    absoluta

    if ii fx xxi ii fxx 2xxi ii fxx

    2

    1 2 2 4 8 16 32

    5 1 6 0 0 0 0

    9 2 18 4 8 16 32

    Total N = 5 26 16 64

  • Tema 1: Estadstica.

    Gema Isabel Marn Caballero Pgina 39 de

    39

    Media aritmtica: 52,55

    26x

    Rango o recorrido: 819 R

    Desviacin media: 2,35

    16DM

    Varianza: 8,125

    642

    Desviacin tpica: 578,38,12

    Coeficiente de variacin: 716,05

    578,3CV

    En este caso, las medidas de dispersin son bastante grandes. Esto indica que, aunque la media

    aritmtica sea 5, este valor no es muy representativo de los datos.

    4.2.3.4. Con datos agrupados en intervalos

    A continuacin, presentamos varios ejemplos para variables cuantitativas continuas.

    4.2.3.5. Resumen de medidas de dispersin

    En la tabla siguiente, se presentan los tipos de medidas de dispersin con las variables

    estadsticas que se suelen usar.

    Tipos de medidas de dispersin Tipos de variables

    Rango o recorrido Variables cuantitativas discretas y continuas.

    Desviacin media Variables cuantitativas discretas y continuas.

    Varianza Variables cuantitativas discretas y continuas.

    Desviacin tpica Variables cuantitativas discretas y continuas.

    Coeficiente de variacin Variables cuantitativas discretas y continuas.

    En la tabla siguiente, se presenta un resumen de los tipos de medidas de dispersin.

    Tipos Cmo se calcula Variables cuantitativas continuas

    Rango o recorrido 1xxR n 1LLR n

    Desviacin media

    N

    fxx

    DM

    n

    i

    ii

    1

    ix = marca de clase del intervalo.

    Varianza

    N

    fxxn

    i

    ii

    1

    2

    2

    Desviacin tpica 2

    Coeficiente de variacin x

    CV