Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra...

41
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 2 PRESENTACIÓN GRÁFICA DE DATOS

Transcript of Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra...

Page 1: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Curso de Estadística Básica

MCC. Manuel Uribe Saldaña

MCC. José Gonzalo Lugo Pérez

SESION 2

PRESENTACIÓN GRÁFICA DE DATOS

Page 2: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Objetivo

Aprender cómo presentar y describir conjuntos de

datos

Page 3: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Agenda Sesión 2

• Presentación gráfica

de datos

– Diagramas de pastel

y gráficas de barras

– Diagrama de Pareto

– Gráfica de Puntos

– Distribución de

frecuencia

– Histogramas

Page 4: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Resultados del examen de

matemáticas…

Calificación: 78

E: ¿Cuál fue la calificación promedio del examen?

I: el promedio del salón fue de 68

E: ¿cuán próxima del máximo está mi calificación?

I: las calificaciones variaron de 42 a 87 puntos.

42 68 78 87

Page 5: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Resultados del examen de

matemáticas…

Calificación: 78

E: ¿Cómo están distribuidas las calificaciones?

I: la mitad del grupo obtuvo calificaciones entre 65 y 75.

Conclusión del estudiante: su calificación es buena

Page 6: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Reflexión…

• Conjunto de datos: Calificaciones del examen

• Estadísticas descriptivas: calificación promedio y calificaciones máxima y mínima

• Con esta información los estudiantes pueden obtener conclusiones sobre su éxito relativo

Page 7: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Estadística descriptiva

Medidas de

tendencia

central

Medidas de

dispersión

Medidas de

posición

Tipos de

distribución

Page 8: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Gráficas

• Una vez recolectado los datos de la muestra, es necesario“familiarizarse” con ellos.

• Aplicar una técnica inicial exploratoria de análisis de datos queproduzca una representación visual.

• Las representaciones visuales revelan patrones de comportamientode la variable de estudio.

• Existen muchas formas gráficas (visuales) para describir los datos.

• El método que se aplique es determinado por el tipo de datos y elconcepto a representar.

NOTA: Cuando se elabora una representación gráfica no existe solamente unarespuesta correcta. El juicio del analista y las circunstancias que rodean alproblema desempeñan un papel primordial en el desarrollo de la gráfica.

Page 9: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Diagramas de pastel

• Gráficas que se utilizan

para resumir datos de

atributo (cualitativos).

Los diagramas de pastel

muestran la cantidad de

datos que pertenecen a

cada categoría como

una parte proporcional

de un círculo.

Page 10: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejemplo

Tipo de operación Número de casos

Torácica 20

Huesos y articulaciones 45

Ojos, oídos, nariz y garganta 58

General 98

Abdominal 115

Urológicas 74

Proctológicas 65

Neurocirugía 23

Total 498

En la tabla se muestra el número de casos de cada tipo

de operación realizada en el Hospital General, el año

pasado

Page 11: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

EjemploEstos datos se muestran en un diagrama de pastel, donde cada tipo de operación

está representado por una proporción relativa del círculo identificada con un

porcentaje.

Page 12: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Diagramas de barras

• Gráficas que se utilizan

para resumir datos de

atributo (cualitativos).

Las gráficas de barras

muestran la cantidad de

datos que pertenecen a

cada categoría como

áreas rectangulares de

tamaño proporcional.

Page 13: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

EjemploEn la figura se presentan los mismos datos sobre el “tipo de operación” en forma de

gráfica de barras

Page 14: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Pregunta

• En su opinión, con qué

gráfica, diagrama de

pastel o gráfica de

barras, se obtiene una

mejor representación de

la información?

Page 15: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Respuesta

• La gráfica de círculo

facilita la comparación

visual de los tamaños

relativos de las partes

entre sí y el tamaño de

cada parte con respecto

al todo.

Page 16: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Diagrama de Pareto

Gráfica de barras con éstas dispuestas de la categoría más numerosa a la

menos numerosa. Incluye una gráfica hecha a base de rectas que muestra

los porcentajes acumulados y la cantidad de datos representada por cada

barra. Es una representación gráfica de los datos obtenidos sobre un

problema, que ayuda a identificar cuáles son los problemas prioritarios que

hay que tratar

Page 17: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejemplo

Estadísticas de delitos por animadversión cometidos en 1993

0

500

1000

1500

2000

2500

3000

3500

4000

4500

Can

tid

ad

0,00%

20,00%

40,00%

60,00%

80,00%

100,00%

120,00%

Po

rcen

taje

Cantidad 4168 1189 806 583

Porcentaje acumulado 61,78% 79,41% 91,36% 100,00%

Racial Religioso Sexual Étnico

Page 18: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Consejos para elaborar y usar los

diagramas de Pareto

• No es conveniente que la categoría de “otros”represente un porcentaje de los más altos. De ser así,se debe utilizar un método diferente de clasificación.

• Es preferible representar los datos (si es posible) envalores monetarios.

• Si un factor se puede solucionar fácilmente debeafrontarse de inmediato aunque sea de pocaimportancia.

• Es imprescindible realizar un diagrama de causas si sequieren realizar mejoras

Page 19: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejercicio

1. Se tienen los datos de una

inspección final de defectos para la

línea de ensamble A12

organizados en la siguiente tabla:

2. Representar los datos en un

diagrama de pareto

Defecto Cantidad

Manchado 56

Rayado 45

Astillado 23

Doblado 12

Abollado 8

Otros 6

Page 20: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Pareto de la línea de ensamble A12

Defectos del producto

0

10

20

30

40

50

60

Can

tid

ad

0,0%

20,0%

40,0%

60,0%

80,0%

100,0%

120,0%

Po

rcen

taje

Cantidad 56 45 23 12 8 6

Porcentaje acumulado 37,3% 67,3% 82,7% 90,7% 96,0% 100,0%

Manchado Rayado Astillado Doblado Abollado Otros

Page 21: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejercicio propuesto

Utilizando como herramienta el diagrama de Pareto, analice las pérdidas

por rechazos en una fábrica de papel, teniendo en cuenta que se han

detectado los conceptos que se muestran en la tabla siguiente, en la que

también se indican los costes asociados a cada concepto.

Page 22: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Gráficas para datos cuantitativos

• Una razón fundamental para elaborar una gráfica de datos cuantitativos esmostrar la distribución de éstos.

Distribución

• Patrón de variabilidad mostrado por los datos de una variable. Ladistribución muestra la frecuencia de cada valor de la variable.

Page 23: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Gráfica de puntos

• Presenta los datos de una muestra mediante la representación de cada porción de

datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u

horizontal. La frecuencia de los valores está representada a lo largo de la otra

escala.

19 Calificaciones del examen

0

0,5

1

1,5

2

2,5

3

3,5

0 20 40 60 80 100 120

Calificación

Fre

cu

en

cia

Page 24: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Gráfica de puntos

• La gráfica de puntos es una técnica que conviene utilizar alinicio del análisis de los datos. Esta representación da porresultado una imagen y una clasificación de los datos en ordennumérico. (Clasificar datos es ordenarlos según el valornumérico)

Page 25: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejercicio

Se eligió una muestra aleatoria de 50 estudiantes universitarios. Sus pesos

fueron obtenidos de sus registros médicos. En la siguiente tabla se

muestran los datos resultantes: obtener el diagrama de puntos y una

conclusión

Estudiante 1 2 3 4 5 6 7 8 9 10

Sexo: Masculino (M)

Femenino (F) F M F M M F F M M F

Peso 98 150 108 158 162 112 118 167 170 120

Estudiante 11 12 13 14 15 16 17 18 19 20

Sexo: Masculino (M)

Femenino (F) M M M F F M F M M F

Peso 177 186 191 128 135 195 137 205 190 120

Estudiante 21 22 23 24 25 26 27 28 29 30

Sexo: Masculino (M)

Femenino (F) M M F M F F M M M M

Peso 188 176 118 168 115 115 162 157 154 148

Estudiante 31 32 33 34 35 36 37 38 39 40

Sexo: Masculino (M)

Femenino (F) F M M F M F M F M M

Peso 101 143 145 108 155 110 154 116 161 165

Estudiante 41 42 43 44 45 46 47 48 49 50

Sexo: Masculino (M)

Femenino (F) F M F M M F F M M M

Peso 142 184 120 170 195 132 129 215 176 183

Page 26: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Distribuciones de frecuencia

Los listados de grandes conjuntos de datos no presentan una imagen

valiosa. A veces se desea condensar los datos en una forma más

manejable. Esto puede lograrse con ayuda de una distribución de

frecuencia.

Distribución de frecuencias

Listado, a menudo expresado en forma de diagrama, que asocia cada valor

de una variable con su frecuencia.

Page 27: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejemplo

3 2 2 3 2

4 4 1 2 2

4 3 2 0 2

2 1 3 3 1

Si x representa una variable, puede usarse una distribución de frecuencias para

representar este conjunto de datos enumerando los valores x con sus

frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por

tanto, la frecuencia de x = 1 es 3.

Se tiene el siguiente conjunto de datos:

x f

0 1

1 3

2 8

3 5

4 3

Page 28: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Frecuencia

La frecuencia f es el número de veces que aparece el valor x en la muestra.

La tabla anterior es una distribución de frecuencias no agrupadas,

porque cada valor de x en la distribución permanece solo. Cuando un gran

conjunto de datos tiene muchos valores x distintos, es posible agrupar los

valores en un conjunto de clases y elaborar una distribución de

frecuencias agrupadas.

Page 29: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejercicio

Forme una distribución de frecuencias no agrupadas de

los datos resultantes: 1, 2, 1, 0, 4, 2, 1, 1, 0, 1, 2, 4

Page 30: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Distribución de frecuencias Agrupadas

y No Agrupadas

Calificaciones Frecuencia

52 1

62 1

66 1

68 1

72 1

74 2

76 3

78 2

82 2

84 1

86 1

88 1

92 1

96 1

Total 19

De un grupo grande se extrajo aleatoriamente una muestra de 19 calificaciones

de un examen: 76 74 82 96 66 76 78 72 52 68

86 84 62 76 78 92 82 74 88

Distribución de frecuencias no agrupadas

Distribución de frecuencias agrupadas

Clase Frecuencia

50 ≤ x < 60 1

60 ≤ x < 70 3

70 ≤ x < 80 8

80 ≤ x < 90 5

90 ≤ x < 100 2

Total 19

50 o más hasta menos que 60

60 o más hasta menos que 70

70 o más hasta menos que 80

80 o más hasta menos que 90

90 o más hasta menos que 100

Page 31: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

19 Calificaciones del examen

0

0,5

1

1,5

2

2,5

3

3,5

0 20 40 60 80 100 120

Calificación

Fre

cu

en

cia

19 Calificaciones del examen

0

1

2

3

4

5

6

7

8

9

0 20 40 60 80 100 120

Calificacion

Fre

cuen

cia

Distribución de frecuencias no agrupadas

Distribución de frecuencias agrupadas

Distribución de frecuencias Agrupadas

y No Agrupadas

Page 32: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Procedimiento para elaborar una

distribución de frecuencias agrupadas

1. Cada clase debe ser del mismo ancho

2. Las clases deben estar dispuestas de modo que no se superpongan y que cada porción de información pertenezca exactamente a una clase

3. La raíz cuadrada de n es un lineamiento razonable para el número de clases con muestras de menos de 150 datos.

4. Utilizar un sistema que aproveche un patrón numérico, para garantizar precisión

5. Cuando sea conveniente, un ancho de clase par suele ser ventajoso

Page 33: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejemplo

Se considera una muestra de 50 puntajes del examen

final del curso de estadística básica. A continuación se

muestran los puntajes:

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 68 97 70 64 70 70

58 78 89 44 55 85 82 83 72 77

72 86 50 94 92 80 91 75 76 78

Page 34: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Procedimiento

1. Identifique los puntajes máximo y mínimo y determine el rango.

Máx = 98, Mín = 39.

Rango = Máx – Mín = 98 – 39 = 59

2. Elija un número de clases m y un ancho de clase c de modo que elproducto mc sea ligeramente mayor que el rango

m = raíz cuadrada de n = 50

m = 7

c = 10

mc = 70 Es mayor que el rango = 59

Page 35: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Procedimiento

3. Elija un punto inicial, que debe ser algo menor que el puntaje másbajo (min). Posteriormente se cuenta a partir de ahí enincrementos del ancho de clase. Cada número obtenido sedenomina límites de clase.

35 ≤ x < 45

45 ≤ x < 55

55 ≤ x < 65

65 ≤ x < 75

75 ≤ x < 85

85 ≤ x < 95

95 ≤ x < 105

Page 36: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Procedimiento

4. Una vez establecidas las clases, es necesario clasificar los datosen dichas clases. El método utilizado para realizar la clasificacióndepende del formato actual de los datos: si los datos estánordenados, es posible contar las frecuencias; si los datos no estánordenados, se efectúa un conteo de éstos para determinar losnúmeros de frecuencia. Cuando se efectúa la clasificación de losdatos, es de utilidad usar un diagrama estándar.

Número de clases Límites Frecuencia

1 35 ≤ x < 45 2

2 45 ≤ x < 55 2

3 55 ≤ x < 65 7

4 65 ≤ x < 75 13

5 75 ≤ x < 85 11

6 85 ≤ x < 95 11

7 95 ≤ x < 105 4

50

Page 37: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Notas

1. Si se han ordenado los datos (en forma de lista, gráficade puntos o representación de tallo y hojas) el conteoes innecesario; simplemente se cuentan los datos quepertenecen a cada clase.

2. Si los datos no están ordenados, debe tenerse cuidadoal efectuar el conteo.

3. La frecuencia f para cada clase es el número de datosque pertenecen a esa clase.

4. La suma de frecuencias debe ser exactamente igual alnúmero de datos n (n = Σf). Esta sumatoria es unaverificación aceptable.

Page 38: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Notas

5. Cada clase requiere un solo valor numérico para representar todos

los valores de datos que caen en esa clase. La marca de clase

(algunas veces denominada punto medio de clase) es el valor

numérico que está exactamente a la mitad de ésta y se encuentra

al sumar los límites de clase y dividirlo entre 2.

Número de clases Límites Frecuencia Marca de clase

1 35 ≤ x < 45 2 40

2 45 ≤ x < 55 2 50

3 55 ≤ x < 65 7 60

4 65 ≤ x < 75 13 70

5 75 ≤ x < 85 11 80

6 85 ≤ x < 95 11 90

7 95 ≤ x < 105 4 100

50

Page 39: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Histograma

Gráfica de barras que representa una distribución

de frecuencias de una variable cuantitativa. Un

histograma está integrado por los siguientes

componentes:

1. Un título, que identifica la población o la muestra de interés

2. Una escala vertical, que identifica las frecuencias que hay

en las diversas clases

3. Una escala horizontal, que identifica la variable x. Los

valores de los límites de una clase de las marcas de clase

deben identificarse a lo largo del eje x. El empleo de

cualquier método para identificar el eje presenta mejor a la

variable.

Page 40: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Ejemplo

50 puntajes del examen final de estadística básica

0

2

4

6

8

10

12

14

40 50 60 70 80 90 100

Puntaje

Fre

cu

en

cia

Page 41: Curso de Estadística Básica - uteq.edu.mx CURSO MARS/Sesiones/PDF... · Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación

Estadística Básica

Forma de los histogramas

Simétrico, normal o triangular Uniforme o rectangular Sesgado a la derecha

Sesgado a la izquierda En forma de J Bimodal