Post on 01-Jul-2015
ELEMENTOS DE ESTADÍSTICA ELEMENTOS DE ESTADÍSTICA DESCRIPTIVADESCRIPTIVA
Srta. Yanira Castro Lizana
IntroducciónIntroducciónLa Estadística es una ciencia que
facilita la solución de problemas en los cuales necesitamos conocer características sobre el comportamiento de algún suceso o evento.
Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad de que estos ocurran.
Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, así como realizar proyecciones del comportamiento del suceso.
Sólo se realizan los cálculos y el análisis con los datos obtenidos de una muestra de la población y no con toda la población.
Actualmente el INE es el encargado de concentrar y publicar la información estadística del estado y del país.
Conceptos básicosConceptos básicos Estadística:
Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para después obtener conclusiones. Se divide en Estadística Descriptiva y Estadística Inferencial.
Estadística descriptiva:Se encarga de la recolección, organización, presentación y análisis de los datos de una población.
Estadística inferencial:Se encarga de analizar la información presentada por la estadística descriptiva mediante técnicas que nos ayuden a conocer, con determinado grado de confianza, a la población. Lo que nos permite tomar decisiones.
Población:Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta característica.
Al número de integrantes de la población se llama tamaño de la población y se representa con la letra N.
Las poblaciones pueden ser finitas o infinitas.
Población Estadística:Conjunto de TODOS los DATOS que se obtienen al realizar la medición de una variable en los elementos de una población.
Muestra:Subconjunto de una población, que intenta reflejar las características de la población lo mejor posible.
El número de individuos que integran la muestra, llamado tamaño de la muestra se representa con la letra n.
Individuo:Es el elemento de la población o de la muestra que aporta información sobre lo que se estudia.
Variable:Característica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o varía con el tiempo en un individuo dado, o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Dato:Valor que se obtiene al realizar la medición de la característica de la variable en estudio.Pueden ser univariados, bivariados o multivariados.
La naturaleza de los datos pueden ser datos cuantitativos o datos cualitativos.
Datos Cuantitativos (números):Valores obtenidos al medir peso, estatura, temperatura, número de hijos.
Datos Cualitativos (categorías):Se obtienen al calificar la característica en cuestión como el sexo, estado civil, grado máximo de estudios.
Variable Dicotómica:Sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mujer, bueno – malo, encendido – apagado).
En la variable CUANTITATIVA se pueden distinguir dos tipos: continua y discreta.
Variable Continua:Si la variable puede tomar cualquier número real entre dos valores dados (decimal o entero). Ej. El peso de un individuo.
Variable Discreta:Si la variable sólo puede tomar números enteros.Ej. El número de hijos de un individuo.
Escalas de MediciónEscalas de Medición
Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
Escala Nominal:Está asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritméticas entre sus valores, pues éstos son únicamente ETIQUETAS.
Ejemplo: sexo, código postal, estado civil, número telefónico, número al correr en un maratón, deporte favorito, carrera a estudiar, etc.
Escala Ordinal:Los valores de la variable que tienen un ORDEN con un nivel específico, pero no se pueden hacer operaciones aritméticas entre ellas.
Ejemplo: Pésimo – Malo – Regular – Bueno – ExcelentePrimaria – Secundaria – Preparatoria - Licenciatura
Escala de Intervalo:En ella existe un orden entre los valores de la variable y además una NOCIÓN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es único, es más bien un punto de referencia.
Ejemplo: Escalas de temperatura, la edad de la Tierra, la línea del tiempo de la humanidad.
Escala de Razón:La magnitud tiene SENTIDO FÍSICO, existe el cero absoluto, existe orden, se puede determinar cuántas veces es mayor uno que otro.
Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Fuentes de informaciónFuentes de información
Encuesta:Recopilar los datos mediante el uso de cuestionarios o entrevistas.
Experimento:Procedimiento utilizado en la investigación científica para obtener información que permita conocer el comportamiento de algún proceso.
Fuentes de InformaciónFuentes de Información
Investigación Documental:Procedimiento para obtener datos mediante la consulta de información ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales.
Orden de datosOrden de datos
La ordenación es el proceso mediante el cual los datos están acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.
Hay dos métodos comunes:• Listado en orden ascendente
• Método de tallo y hojas
EjemploEjemploConsidera que la variable de estudio es el
peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:
Peso de 25 estudiantes (en kg)
40 43 48 51 4956 44 42 55 5252 62 44 50 5963 50 56 55 4557 66 63 51 58
Listado en orden ascendenteListado en orden ascendenteEl proceso consiste en ordenarlos de
menor a mayorPeso de 25 estudiantes (en kg)
42 40 48 51 4956 44 43 55 5252 62 44 50 5963 50 56 55 4557 66 63 51 58
Peso de 25 estudiantes (en kg)
40 42 43 44 4445 48 49 50 50
51 51 52 52 5555 5656 57 5859 62 63 63 66
Método de tallo y hojasMétodo de tallo y hojas
Si los números de los datos están formados por dos dígitos, se hace una columna con el primer dígito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, sólo el segundo dígito (unidades) de cada uno de los datos que tengan el mismo primer dígito.
Datos sin ordenar:
Datos ordenados:
456
456
0,2,3,4,4,5,8,90,0,1,1,2,2,5,5,6,6,7,8,92,3,3,6
Peso de 25 estudiantes (en kg)
42 40 48 51 4956 44 43 55 5252 62 44 50 5963 50 56 55 4557 66 63 51 58
2,0,8,9,4,3,4,51,6,5,2,2,0,9,0,6,5,7,1,82,3,6,3
Doble talloDoble talloUna variante de este método es en lugar de
dividir en un grupo las decenas, se divide en dos grupos. El primero abarcando los dígitos del 0 al 4 y el segundo del 5 al 9.
El ejemplo anterior queda:
4 0,2,3,4,44 5,8,95 0,0,1,1,2,2,5 5,5,6,6,7,8,96 2,3,36 6
Caso de variables cualitatitivasCaso de variables cualitatitivas
El procedimiento es:
◦ Se identifican todos los valores diferentes y se acomodan en columna.
◦ Se agrega una segunda columna en donde se van registrando, mediante una línea vertical, la veces que aparece el valor dado.
EjemploEjemploConsidera que la variable de estudio es el
color de playera de 25 estudiantes. Los colores se encuentran en la siguiente tabla:
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Color Frecuencia
Azul
Blanco
Café
Gris
Negro
Rosa
Verde
I I I I
I I I I I II I I
I I I II I
I I I II
Tabla de Frecuencia de DatosTabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos, se acomodan en la “Tabla de distribución de frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de valores x-y, dónde “x” representa el dato y “y” representa la frecuencia.
La frecuencia es el número de veces que aparece cada dato.
Hay dos clases de tablas de frecuencias:◦ Para datos NO agrupados.◦ Para datos agrupados.
Tabla de frecuencias para Tabla de frecuencias para datos NO agrupadosdatos NO agrupados
Está formada por dos columnas: una para la variable “xi” y la otra para su frecuencia “f”, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.
EjemploEjemploTabla de frecuencias de los pesos en kg
de 25 alumnos.Peso de 25 estudiantes (en kg)
40 42 43 44 4445 48 49 50 50
51 51 52 52 5555 5656 57 5859 62 63 63 66
xi f
40
42
43
44
45
48
49
50
51
xi f
52
55
56
57
58
59
62
63
66
Total
1
1
12
1
1
1
2
2
2
2
2
11
1
1
21
25
Frecuencia relativa y acumuladaFrecuencia relativa y acumuladaPor lo regular, se agregan dos columnas: la
de la frecuencia relativa “fr” y la de la frecuencia acumulada “fa”.
La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el número total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.
Rango: es la diferencia entre el dato mayor y el dato menor.
EjemploEjemplo
xi f fr fa
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
xi f fr fa
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Total
25
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.08
0.080.08
0.08
0.080.08
0.08
1/25
2/25
1
2
3
5
6
78
10
12
14
1618
1920
21
22
2425
1
Siempre es el
número total
Siempre es 1
Nº de hijos
Nº de familias
F fr
1 2
2 8
3 12
4 14
5 3
6 1
Ejercicio nº1: En una muestra de 40 familias, el número de hijos se distribuye según la tabla:Complete la tabla y responda.•¿Cuántas familias tienen menos de 4 hijos?•¿Cuántas familias tienen 5 hijos?•¿Cuántas familias tienen 5 hijos o menos?•¿Cuál es la frecuencia relativa de las familias de 2 hijos?
La Tabla de Distribución de Frecuencia con DATOS ACUMULADOS ( o AGRUPADOS), es aquella que en la variable los datos se presentan en intervalos también llamados clases. El término central de un intervalo se llama MARCA DE CLASE, que es el representante de la clase. Para determinar el tamaño de cada intervalo (ancho de clase ), se divide el rango por la cantidad de intervalos que se desea obtener. Se forman, tantas clases hasta cubrir el dato mayor.
Intervalo de claseIntervalo de clase
En ocasiones es conveniente acomodar los datos en pequeños grupos de igual tamaño, llamados intervalos de clase.
El punto medio o marca de clase “xi”, se obtiene con:
El tamaño del intervalo se obtiene mediante la diferencia de los límites superior e inferior.
Marca de clase = Límite inferior + límite superior2
Ejemplo Estudiantes de una universidadEjemplo Estudiantes de una universidad
La siguiente tabla muestra el peso de 50 estudiantes entrevistados. a) Ordenar los datos de menor a mayor. b) Determinar el rango. c) Construir los intervalos de clase con su respectiva frecuencia. d) Determinar las frecuencias relativas. e) Determinar las frecuencias relativas porcentuales. f) Determinar las frecuencias acumuladas g) Determinar las frecuencias acumuladas relativas. h) Determinar las marcas de clase de cada intervalo.
Peso de los estudiantes en kilogramos
50 67 50 58 61 59 41 59 42 60 55 48 45 58 69 46 51 52 40 65 53 52 68 53 46 60 50 54 54 40 44 41 49 45 47 56 48 53 55 51 47 52 51 58 54 51 52 55 60 58
Peso de los estudiantes en kilogramos
40 44 47 50 51 52 54 56 59 6540 45 47 50 51 53 54 58 59 6641 45 48 50 52 53 55 58 60 6741 46 48 51 52 53 55 58 60 6842 46 49 51 52 54 55 58 61 69
a)Ordenando de menor a mayor la tabla queda ordenada como se indica enseguida:
Rango = Valor mayor - valor menor = (69 - 40)kg = 29 kg
b) Rango
Tamaño de clase = Rango/Número de clases = 29 kg / 6 kg = 4.83
c) Para construir los intervalos de clase con su respectivas frecuencias se procede a determinar primermanete el tamaño de las clases usando la siguiente fórmula:
Tamaño de clase = 5
Redondeando este valor se determina que el tamaño de las clases será igual a 5. Para los 50 datos, utilizando la tabla de Ryan, se emplearán 6 clases.
Teniendo estos valores se procede a realizar la tabla de frecuencias. Se empezará con el valor menor que es 40 y se toman 5 valores en orden ascendente de acuerdo al tamaño de clase que obtuvimos anteriormente, esto es: 40, 41, 42, 43 y 44. Por lo que el primer intervalo quedará como: 40-44, el segundo sería 45, 46, 47, 48, 49 (45-49), el tercero 50-54 y así sucesivamente hasta completar la tabla que se muestra enseguida:
Clase Frec. Frec. Frec. relat. Frecuencia Frec. acum. relativa porcentual acumulada relativa 40 - 44 6 0.12 12 6 12 45 - 49 9 0.18 18 15 30 50 - 54 17 0.34 34 32 64 55 - 59 10 0.20 20 42 84 60 - 64 3 0.60 60 45 90 65 - 69 5 0.10 10 50 100 Total 50 1.00 100%
Marca de clase = (Límite inferior + Límite superior) / 2
Para la primera clase: (40+44) / 2 = 84 / 2 = 42; Para la segunda clase: (45+49) / 2 = 94 / 2 = 47; etc. Por lo que tabla completa quedará como se indica enseguida:
Clase Marcas de Frec. Frec. Frec. relat. Frecuencia Frec. acum. clase relativa porcentual acumulada relativa 40 - 44 42 6 0.12 12 6 12 45 - 49 47 9 0.18 18 15 30 50 - 54 52 17 0.34 34 32 64 55 - 59 57 10 0.20 20 42 84 60 - 64 62 3 0.60 60 45 90 65 - 69 67 5 0.10 10 50 100 Total 50 1.00 100%
Las marcas de clase nos servirán para construir histogramas y polígonos de frecuencia que será un tema que se verá mas adelante. Lo im
Las marcas de clase nos servirán para construir histogramas y polígonos de frecuencia que será un tema que se verá mas adelante. Lo importante por ahora es conocer claramente como se construye una tabla de frecuencias y las partes que se originan después de dicha construcción.
EjemploEjemplo
Intervalo de clase Punto medio “xi”
38 – 42 4043 – 47 4548 – 52 5053 – 57 5558 – 62 6063 – 67 65
Límite inferior Límite superior Lím inf + Lim sup2
Límite verdadero del intervaloLímite verdadero del intervaloFrontera de clase o límite verdadero del
intervalo:Intervalo de clase Punto medio “xi”
37.5 – 42.5 4042.5 – 47.5 4547.5 – 52.5 5052.5 – 57.5 5557.5 – 62.5 6062.5 – 67.5 65
40 – 2.5 40 + 2.5
Ejercicio n°3: Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de estudiantes de 4° años de educación media. Construya una tabla de distribución de frecuencia con datos acumulados, usando 6 intervalos. La tabla debe tener las siguientes columnas: variable, frecuencia absoluta, Frecuencia acumulada, frecuencia relativa, marca de clase.
•¿De cuántos elementos consta la muestra?•¿Cuánto es el rango?•¿Cuánto es el ancho de la clase?•¿Cuántos alumnos miden entre 1,75 m y 1,89 m.?•¿Cuál es la marca de clase de 1,80 – 1,84?•¿Qué frecuencia absoluta tiene 1,70 – 1,74?
Tabla de intervalos con Tabla de intervalos con límites verdaderoslímites verdaderos
Usando símbolos de desigualdad
Usando paréntesis y corchetes
Intervalo de clase
Punto medio
“xi”
37.5 ≤ x < 42.5 40
42.5 ≤ x < 47.5 45
47.5 ≤ x < 52.5 50
52.5 ≤ x < 57.5 55
57.5 ≤ x < 62.5 60
62.5 ≤ x < 67.5 65
Intervalo de clase
Punto medio
“xi”
[37.5 , 42.5) 40
[42.5 , 47.5) 45
[47.5 , 52.5) 50
[52.5 , 57.5) 55
[57.5 , 62.5) 60
[62.5 , 67.5) 65
Está incluido No está incluido Está incluido No está incluido
El tamaño del intervalo es de 5
Tabla de distribución de frecuencias Tabla de distribución de frecuencias para datos agrupadospara datos agrupados
Se elabora con los intervalos de clase, sus puntos medios y las frecuencias correspondientes para cada uno de los intervalos.
xi f
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Total 25
Dat
os s
in a
grup
ar Intervalo de clase
Punto medio “xi”
f
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 - 67 65
Total
Datos agrupados
24
8
5
3
3
25
Se agregan las columnas de frecuencia relativa “fr” y frecuencia acumulada “fa”:
Intervalo de clase
Punto medio “xi”
f fr Fa
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Total 25
0.080.16
0.32
0.20
0.12
0.12
1
2
6
14
19
2225
2/25
4/25
8/25
Por último se agregan las columnas:◦ Frecuencia porcentual, “f%” ó “%f”, se
obtiene multiplicando la frecuencia relativa “fr” x 100.◦ Frecuencia relativa acumulada “fra”, se
obtiene sumando las frecuencias relativas anteriores a un dato dado.◦ Frecuencia porcentual acumulada, “f%a”,
se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.
Tablas de frecuencias absoluta, Tablas de frecuencias absoluta, relativa y acumuladarelativa y acumulada
Intervalo de clase
Punto medio “xi”
f fr f% fa fra f%a
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63 - 68 65 3 0.12 25
Total 25 1
8
16
32
20
12
12100
0.08
0.24
0.56
0.760.88
1
824
5676
88100
0.08 x 100
2/25
0.08 x 100
Gráfica de DatosGráfica de DatosExisten dos tipos de gráficas mas usuales:◦ Polígono de Frecuencias◦ Histograma
Otros gráficos:◦ Gráfica de barras◦ Pictograma◦ Gráfico Circular o de pastel.
Polígono de FrecuenciasPolígono de FrecuenciasEs la representación mediante un gráfico
de línea. En él se muestra la distribución de frecuencias y está formado por segmentos de línea que unen los puntos correspondientes a la frecuencia de cada una de las clases.
El eje “x” representa el dato “xi” y el eje “y” las frecuencias. 0
10
2 0
3 0
4 0
50
6 0
EjemploEjemplo
Intervalo de clase
Punto medio “xi”
f
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Total 25
El eje “y” puede ser sustituido por las frecuencias relativas o porcentuales.
fr
xi
Polígono de Frecuencia Relativa
% f
xi
Polígono de Frecuencia Porcentual
HistogramaHistogramaEs la representación gráfica de los datos mediante una sucesión
de rectángulos.Está formado por rectángulos cuya
anchura representa a cada uno de los intervalos y la altura corresponde a la frecuencia.
En el eje “x” estarán los límites verdaderos, los puntos medios y en el eje “y” las frecuencias.
0,95 2,95 4,950
2
4
6
8
10
12
14
Intervalo de clase
Punto medio “xi”
f
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Total 25
EjemploEjemplo
También podemos usar la frecuencia relativa y la frecuencia porcentual.
fr
xi
% f
xi
Pirámide PoblacionalPirámide Poblacional
Una variante en el histograma es colocar en el eje “x” de tal manera que las columnas quedarán en forma horizontal, es muy común en datos poblacionales.
OjivaOjivaEs la representación gráfica de las
frecuencias acumuladas mediante un gráfico de línea. Se muestra la distribución de frecuencias acumuladas de los datos.
En el eje “x” estarán los puntos medios y en el eje “y” las frecuencias acumuladas.
EjemploEjemplo
Intervalo de clase
Punto medio “xi”
f fr fa
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63 - 68 65 3 0.12 25
Total 25 1
Usando la frecuencia acumulada y la frecuencia porcentual.
Intervalo de clase
Punto medio “xi”
f fr f% fa fra f%a
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63 - 68 65 3 0.12 12 25 1 100
Total 25 1 100
Gráfico CircularGráfico CircularTambién es llamado gráfico de pastel.
Sólo se representan datos de frecuencias relativas o frecuencias porcentuales.
Se debe dividir el área del círculo de manera proporcional a las frecuencias.13%
17%
57%
13%PERRO
PAJARO
HAMSTER
GATO
Agregaremos una columna a nuestra tabla de frecuencias “Frecuencia relativa al círculo”, multiplicando (fr)(360°), para mostrar la parte proporcional de círculo medida en grados que corresponde a cada intervalo.
Ejemplo 1Ejemplo 1
Intervalo de clase
Punto medio “xi”
f fr (fr ) (360°)
38 – 42 40 2 0.08
43 – 47 45 4 0.16
48 – 52 50 8 0.32
53 – 57 55 5 0.20
58 – 62 60 3 0.12
63- 68 65 3 0.12
Total 25 1
28.8°
0.08 x 360°
0.16 x 360°
57.6°
115.2°
72°
43.2°
43.2°360°
Ejemplo 2Ejemplo 2
Color Frecuencia
Conteo
Azul 4
Blanco 7
Café 3
Gris 4
Negro 2
Rosa 4
Verde 1
I I I I
I I I I I II I I
I I I II I
I I I II
Otros GráficosOtros GráficosLa gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan separadas unas de otras.
La escala en el eje “x” es para mostrar categorías o intervalos de números NO consecutivos.
0
10
20
30
40
50
60
PERRO PAJARO HAMSTER GATO
Fre
cuen
cia
abso
luta
Carrera Alumnos
Medicina 8
Mecánica 11
Civil 8
Agronomía 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
PictogramaPictogramaSimilar al de barras, sólo que se
sustituyen por figuras, generalmente relacionadas con la variable estudiada.