1. Estadistica Descriptiva - Ejercicios Resueltos

20
1.- Estadística Descriptiva Ejercicios Resueltos Clasificación de variables Gráficos estadísticos Medidas de ubicación Medidas de variabilidad poblacional y muestral Aplicación de datos no agrupados y agrupados

description

Guía elaborada con ejercicios resueltos de Estadística Descriptiva, los cuales tratan temas como Clasificación de variables, Gráficos estadísticos, Medidas de ubicación, Medidas de variabilidad poblacional y muestral; y Aplicación de datos no agrupados y agrupados

Transcript of 1. Estadistica Descriptiva - Ejercicios Resueltos

1.- Estadística Descriptiva

– Ejercicios Resueltos –

Clasificación de variables

Gráficos estadísticos

Medidas de ubicación

Medidas de variabilidad poblacional y muestral

Aplicación de datos no agrupados y agrupados

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 2 Alejandro González Tapia – Ingeniería Civil en Minas

1.- La distribución de los 20.000 empleados de la empresa Alfa, según antigüedad (X) y sueldo

mensual (Y) se muestra en la siguiente tabla de proporciones (frecuencias relativas)

conjuntas:

X

Y ( en miles de $) (en años) 50 – 90 90 – 130 130 – 170 170 – 250

menos de 4 0,12 0,08 0,04 0,00

4 – 8 0,08 0,12 0,10 0,05

más de 8 0,00 0,12 0,18 0,11

1.1) Clasifique las variables del problema según tamaña del recorrido y nivel de medición

1.2) Grafique la distribución de los empleados según sueldo mensual

1.3) ¿En qué grupo son más homogéneos los sueldos de la empresa, en el de los

empleados más nuevos o en el de los más antiguos? Justifique su respuesta.

1.4) Si para las fiestas patrias la empresa otorgo un aguinaldo de $25.000 a los empleados

cuyo sueldo era inferior a los $120.000, mientras que para aquellos cuyo sueldo era

superior a esa cifra el aguinaldo fue de $15.500, ¿Cuántos de los empleados que tienen

más de 8 años de antigüedad en la empresa recibieron un aguinaldo de $15.500?

1.1) Solución:

Variable Según Tamaño del recorrido Según Nivel de Medición

𝑥 Discreta Ordinal

𝑦 Continua De Razón

1.2) Solución:

k = 40

𝑦 (en miles de $)

𝐶𝑖 ℎ𝑖 𝑛𝑖 𝑛𝑖 / 𝐶𝑖 𝑘 ∙ 𝑛𝑖/𝐶𝑖

50 - 90 40 0.2 4000 100 4000

90 - 130 40 0.32 6400 160 6400

130 - 170 40 0.32 6400 160 6400

170 - 250 80 0.16 3200 40 1600

1 n = 20.000

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 3

1.3) Solución: Sean: 𝑍 = “Sueldo empleados más nuevos (menos de de 4 años)”

𝑊 = “Sueldo empleados más antiguos (más de 8 años)”

Obs: La desviación estándar que es calculada corresponde a la poblacional, ya que se trabaja con la

totalidad de datos.

𝑆(𝑍) = 29,8173

�̅� = 96,6666 𝐶𝑉(𝑍) =

𝑆(𝑍)

�̅�∙ 100 =

29,8173

96,6666∙ 100 = 30,8455%

𝑆(𝑊) = 37,6170

�̅� = 154,3902 𝐶𝑉(𝑊) =

𝑆(𝑊)

�̅�∙ 100 =

37,6170

154,3902∙ 100 = 24,3649%

Respuesta: Debido a que 𝐶𝑉(𝑍) > 𝐶𝑉(𝑊), la distribución de los sueldos de los empleados más

antiguos es más homogénea que la distribución de los sueldos de los empleados menos antiguos.

1.4) Solución:

𝑦 𝑛𝑖 𝑁𝑖

50 - 90 0 0

90 – 130 2400 2400

130 – 170 3600 6000

170 – 250 2200 8200

n = 8200

Utilizando la fórmula de percentil:

Pk = 𝑥′𝑖−1 + 𝐶i (

𝑝∙n

100− Ni−1

ni)

Obs: Recordar que el percentil toma los números menores o igual al número indicado, por lo tanto, en

esta ocasión son considerados los números contenidos que son menores o iguales a $120.000.

120 = 90 + 40 ∙(

𝑝 ∙ 8200

100− 0)

2400

𝑝 = 21,95% = 0,2195

Luego, como el ejercicio le solicita la cantidad de empleados con más de 8 años de antigüedad en la

empresa que recibieron un aguinaldo de $15.500, o sea , los empleados que tienen un sueldo

superior a los $120.000, por ende, tendremos que utilizar propiedades de complemento para poder

obtener lo que nos piden.

𝑃(𝑌 > 120) = 1 – 𝑃(𝑌 < 120) = 0,7805

Finalmente, se multiplica la probabilidad por la población considerada (n):

𝑛 ∙ 𝑃(𝑌 > 120) = 0,7805 ∙ 8.200 = 6400

Respuesta: El 78,05% de los empleados con más de 8 años de antigüedad ganan más de $120.000,

o sea, reciben un aguinaldo de $15.500, lo que corresponde a 6400 empleados.

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 4 Alejandro González Tapia – Ingeniería Civil en Minas

2.- Una empresa que se dedica a la fabricación de mallas de acero para hormigón armado, ha

tomado una muestra de las mallas que compró una constructora en un mes determinado,

registrando por cada unidad el peso de la mañana (en kg.), X, el tipo de malla, Y, (con borde: C,

sin borde: S) y el diámetro de las barras (en mm.), Z. Los resultados obtenidos fueron los

siguientes:

X

Z Y (15 – 28] (28 – 4] (41 – 54] (54 – 67] más de 67

menos de 5 C 10 6 4 2 0

S 8 4 2 0 0

(5,0 – 7,0] C 2 8 3 11 4

S 2 6 5 11 0

más de 7 C 0 4 4 20 7

S 0 2 5 15 5

2.1) Clasifique las variables según escala de medición y tamaño de recorrido.

2.2) Encuentre la medida de posición más adecuada para el peso de la malla.

2.3) ¿Qué porcentaje de las mallas con bordes tienen un diámetro de barras superiores a 5,5

mm.?

2.4) ¿Cuál es la variabilidad del peso de las mallas sin bordes que tienen diámetro de barras

menores a 5,0 mm.?

2.1) Solución:

Variable Según escala de Medición Según Tamaño de Recorrido

X Ordinal Discreta

Y Nominal Binaria o Discreta

Z Ordinal Discreta

2.2) Solución: Notemos que el peso de la malla (X), corresponde a una variable ordinal y asimétrica,

por lo que la medida de posición central más adecuada es la Mediana (Me = 54 Kg.)

2.3) Solución: Lo primero será hacer una tabla con los datos que vamos a ocupar, para poder trabajar

de una manera más clara.

Luego utilizando la fórmula de percentil, tenemos:

𝑃𝑘 = 𝑥′𝑖−1 + 𝐶𝑖 (

𝑝∙𝑛

100− 𝑁𝑖−1

𝑛𝑖)

5,5 = 5,0 + 2,0 (

𝑝∙85

100− 22

28)

𝑝 = 34,12% = 𝑃(𝑍 ≤ 5,5)

Luego por propiedad de complemento obtenemos el porcentaje que es requerido:

𝑃(𝑍 > 5,5) = 100% − 𝑝 = 65,88%

Z 𝑛𝐶 𝑁𝐶

Menos de 5 22 22

(5,0 - 7,0] 28 50

Más de 7 35 85

n = 85

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 5

Respuesta: El porcentaje de las mallas con bordes que tienen un diámetro de barras superiores a 5,5

mm es 65,88%

2.4) Solución: Para empezar distribuimos los datos que utilizaremos, los que serás nuestra

herramienta para poder determinar el Coeficiente de Variación, que corresponde a un indicador de

variabilidad.

𝑆𝑥 = 9,8270

�̅� = 28,9286

𝐶𝑉(𝑥) =𝑠𝑥

�̅�∙ 100 =

9,8270

28,9286∙ 100 = 33,9698%

Respuesta: La variabilidad del peso de las mallas sin bordes que tienen diámetros de barras

menores de 5,0 mm es del 33,97%

3. Los siguientes datos corresponden a las cantidades máximas de emisión diarias de óxido

de azufre (en toneladas) registrada según planta de emisión, en cierta zona industrial.

Cantidad de óxido (ton.) Planta A Planta B Planta C

5 – 10 50 40 20

10 – 15 30 30 40

15 – 20 60 0 70

20 – 25 20 10 15

25 – 30 40 20 5

3.1) Indique la unidad de información y clasifique las variables según escala de medición y

tamaño de recorrido

3.2) Entre las plantas B y C, ¿Cuál presenta mayor variabilidad relativa su promedio de

óxido de azufre emitido?

3.3) ¿Qué porcentaje de las emisiones producidas por la planta C, supera las 28 toneladas?

3.1) Solución: Unidad de información: La planta de emisión

Variable Según Escala de medición Según Tamaño de recorrido

Planta de Emisión Nominal Discreta

Cantidad de Oxido De Razón Continua

𝑥 𝑥𝑖 𝑛𝑆

(15 - 28] 21,5 8

(28 - 41] 34,5 4

(41 - 54] 47,5 2

(54 - 67] 60,5 0

más de 67 0

n = 14

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 6 Alejandro González Tapia – Ingeniería Civil en Minas

3.2) Solución: Sea: 𝑥 = “Cantidades máximas de emisión diarias de óxido de azufre (en ton.)”

𝑥 𝑥𝑖 Planta B Planta C

5 – 10 7,5 40 20

10 – 15 12,5 30 40

15 – 20 17,5 0 70

20 – 25 22,5 10 15

25 – 30 27,5 20 5

𝑆𝐵 = 7,8102

�̅� = 14,5 𝐶𝑉(𝐶) =

7,8102

14,5∙ 100 = 53,8634%

𝑆𝐶 = 4,7404

𝐶̅ = 15,6666 𝐶𝑉(𝐶) =

4,7404

15,6666∙ 100 = 30,258%

Respuesta: Comparando ambas plantas, podemos llegar a la conclusión que la planta que presenta

mayor variabilidad relativa en su promedio de óxido de azufre emitido corresponde a la Planta B.

3.3) Solución: Exponemos la información de la Planta C

Luego, por formula de Percentil, tenemos:

28 = 25 + 5 (

𝑝∙150

100− 145

5)

𝑝 = 98,67%

Luego por propiedad de complemento, obtenemos que el porcentaje que nos piden es 1,33%

Respuesta: El porcentaje de las emisiones producidas por la Planta C que supera las 28 toneladas

corresponden al 1,33%.

4.- En una Empresa constructora se ha registrado información respecto: ingreso mensual (Y),

especialidad (X) y permanencia (Z) en la empresa (en que A = antiguo; N = recién ingresado),

de sus trabajadores, obteniendo lo siguiente:

Ingreso mensual, en miles de pesos

Especialidad Z 100 - 150 150 - 200 200 - 300 más de 300

Albañil A 6 9 5 0

N 9 11 1 0

Carpintero A 1 6 7 9

N 1 2 3 3

Electricista A 3 5 8 1

N 1 5 4 0

Pintor A 2 20 2 0

N 1 10 5 0

𝑥 𝑥𝑖 𝑛𝐶 𝑁𝐶

5 – 10 7,5 20 20

10 – 15 12,5 40 60

15 – 20 17,5 70 130

20 – 25 22,5 15 145

25 – 30 27,5 5 150

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 7

4.1) Clasifique las variables involucradas según nivel de medición. Calcule la medida de

posición más adecuada en cada caso. Indique unidad de información.

4.2) Construya un gráfico que permita mostrar la distribución de los trabajadores según

especialidad

4.3) Construya un gráfico que permita comparar los ingresos de los pintores según

permanencia en la empresa.

4.4) Si entre carpinteros y electricistas tienen un sueldo promedio de $225.000 ¿Cuál es el

sueldo promedio de los trabajadores en la Empresa?

4.5) Si la empresa decide mejorar los sueldos de los trabajadores con ingresos inferiores a

$180.000 ¿Qué porcentaje de los trabajadores se beneficiará con esta medida?

4.6) Si a los albañiles se les otorga una bonificación de $20.000. Compare la dispersión de

los ingresos de los albañiles después de la bonificación con la de los ingresos de los

pintores.

4.1) Solución:

Variable Según Nivel de Medición Medida de posición más adecuada

Especialidad Nominal Mo: Albañil

Permanencia Nominal Mo: Antiguo

Ingreso Mensual Ordinal Me = $183.832,5

Unidad de información: El Trabajador

4.2) Solución:

Especialidad 𝑛𝑖

Albañil 41

Carpintero 32

Electricista 27

Pintor 40

n = 140

Gráfico de barras separadas

Gráfico Circular o de Torta

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 8 Alejandro González Tapia – Ingeniería Civil en Minas

4.3) Solución:

Ingreso Pintores

𝑛𝑖 Antiguo

𝑛𝑖 Recien llegado

ℎ𝑖 Antiguo

ℎ𝑖 Recien llegado

Total

100 – 150 2 1 2 1 3

150 – 200 20 10 20 10 30

200 – 300 2 5 1 2,5 3,5

Más de 300 0 0 01 0 0

Para comparar los ingresos de los pintores según permanencia en la empresa utilizaremos un

Histograma rectificado.

4.4) Solución:

En este ejercicio nos otorgan los sueldos promedios entre carpinteros y electricistas, el que es

$225.000, por lo tanto, trabajaremos con los datos entregados para poder encontrar el sueldo

promedio del total de los empleados de la Empresa, para esto utilizaremos la fórmula de promedio o

media para datos tabulados, la que es:

�̅� =∑ 𝑛𝑖 𝑥𝑖

𝑛

Empleando la formula en los albañiles y pintores, respectivamente.

�̅�𝑎𝑙𝑏𝑎ñ𝑖𝑙 =125 ∙ 15 + 175 ∙ 20 + 250 ∙ 6

41=

6875

41= 167,6829 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 $)

𝑦 𝑦𝑖 𝑛𝑖

(Albañil)

𝑛𝑖

(Pintor)

100 - 150 125 15 3

150 - 200 175 20 30

200 - 300 250 6 7

Más de 300

0 0

41 40

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 9

�̅�𝑃𝑖𝑛𝑡𝑜𝑟 =125 ∙ 3 + 175 ∙ 30 + 250 ∙ 7

40=

7375

40= 184,375 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 $)

Finalmente, para obtener el promedio de los sueldos, se multiplica el promedio por la cantidad de

personas, y por último, se divide por el total (n), de la siguiente manera:

�̅� =

6875

41∙ 41 +

7375

40∙ 40 + 225 ∙ 59

140= 196,607 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 $)

Respuesta: El sueldo promedio de los trabajadores de la Empresa es $196.607

4.5) Solución: Utilizando formula de percentil, tenemos que:

180 = 150 + 50 (

𝑝∙140

100− 24

68)

𝑝 = 46,286%

Respuesta: El porcentaje de los trabajadores que se beneficiarán con la medida será el 46,286%

4.6) Solución: P = “Pintores”; A = “Albañiles”; A* = “Albañiles con bonificación”

𝑆𝑃 = 32,9239

�̅� = 184,375 𝐶𝑉(𝑃) = 0,1786 ∙ 100 = 17,86%

Por propiedad: 𝑆𝐴∗ = 𝑆𝐴; 𝐴∗̅̅ ̅ = �̅� + 20

𝑆𝐴 = 41,0398

�̅� = 167,6829

𝑆𝐴∗ = 41,0398

𝐴∗̅̅ ̅ = 187,6829 𝐶𝑉(𝐴∗) = 0,2186 ∙ 100 = 21,86%

Respuesta: La distribución del sueldo de los pintores tiene menos dispersión (menos variabilidad, es

más homogénea) que la de los albañiles bonificados, o de otra forma, La distribución del sueldo de

los albañiles bonificados tiene mayor dispersión (mayor variabilidad, más heterogénea) que la de los

pintores.

5.- Una empresa constructora de parques y plazas, ha ganado una propuesta para construir

áreas verdes en plazas de una determinada región. Las superficies sembradas, en metros

cuadrados, en 80 plazas y la mezcla de semilla de pasto utilizadas, se resumen en la siguiente

tabla:

Superficie sembrada

Mezcla 200 - 1180 1180 - 3140 3140 - 5100 5100 - 6080 más de 6080

Manquehue 7 4 6 2 0

Estadio 3 6 8 4 3

Ray-grass 0 7 9 5 4

Long Grass-Trevol 2 5 4 1 0

Total 12 22 27 12 7

𝑌 𝑛𝑖 Ni

100 – 150 24 24

150 – 200 68 92

200 – 300 35 127

Más de 300 13 140

n = 140

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 10 Alejandro González Tapia – Ingeniería Civil en Minas

5.1) Clasificación las variables involucradas según nivel de medición y tamaño de recorrido.

5.2) Calcule las medidas marginales de posición más adecuadas para cada variable e

indique las correspondientes medidas de dispersión.

5.3) Construya un gráfico que muestre la distribución de las plazas sembradas según

mezcla de semilla utilizada.

5.4) Compare la dispersión de las superficies sembradas con mezclas de Manquehue con la

dispersión de las superficies sembradas con mezcla Long Grass-Trevol.

5.1) Solución:

Variable Según Nivel de Medición Según Tamaño de Recorrido

Mezcla Nominal Discreta

Superficie Sembrada Ordinal Discreta

5.2) Solución:

Variable Medida Marginal de Posición Medida de Dispersión

Mezcla Moda No existe

Superficie Sembrada Mediana Recorrido intercuartílico

Como ya sabemos que la moda corresponde a él valor con mayor frecuencia en una distribución de

datos, por lo que sólo basta reconocer cual es el que más se repite, sin necesidad de realizar algún

cálculo para determinarlo. En cambio, para poder determinar la Mediana de la Superficie Sembrada,

es necesario aplicar la fórmula de Mediana para datos tabulados:

𝑀𝑒 = 𝑥′𝑖−1 + 𝐶𝑖 [

𝑛

2− 𝑁𝑖−1

𝑛𝑖]

Lo primero será identificar el intervalo en el cual trabajaremos, para ello debemos encontrar donde se

encuentra la mitad, para ello dividimos el tamaño muestral en dos, lo que da un resultado de 40, el

que se encuentra en el intervalo: [3140 – 5100[, por lo que este intervalo utilizaremos para poder

conseguir los datos necesarios para obtener la mediana.

Reemplazando:

𝑀𝑒 = 3140 + 1960 ∙ [

80

2 − 34

27] = 3.575,56 𝑚2

Respuesta: La Moda es semilla de pasto Ray- grass, y la Mediana es igual a 3.575,56 m2

Sup. Sembrada

𝑥𝑖−1 − 𝑥𝑖 𝑛𝑖 𝑁𝑖

Mezcla 𝑛𝑖 200 – 1180 12 12

Manquehue 19 1180 – 3140 22 34

Estadio 24 3140 – 5100 27 61

Ray- grass 25 5100 – 6080 12 73

Long grass Trevol 12 Más de 6080 7 80

Tabla (i) n = 80

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 11

5.3) Solución: Graficaremos los datos de la Tabla (i) para poder representar la distribución de las

plazas sembradas según mezcla de semilla utilizada

5.4) Solución:

𝑆𝑀 = 1747,9860

�̅� = 2598,4210 𝐶𝑉(𝑀) =

1747,9860

2598,4210∙ 100 = 67,27%

𝑆𝐿𝑔𝑇 = 1462,6087

𝐿𝑔𝑇̅̅ ̅̅ ̅ = 2854,1666 𝐶𝑉(𝐿𝑔𝑇) =

1462,6087

2854,1666∙ 100 = 51,24%

Respuesta: Como 𝐶𝑉(𝑀) > 𝐶𝑉(𝐿𝑔𝑇) , la dispersión de las superficies sembradas con mezcla de

Manquehue es más heterogénea que la de las superficies sembradas con mezcla de Long grass

Trevol.

6.- La empresa de telecomunicaciones “E-Box” dispone de la siguiente información

correspondiente a ingresos (en miles de pesos) y antigüedad, de todos sus empleados (en

años), separados por género. Los datos se resumen en el siguiente cuadro:

𝑥 = Sup. Sembrada 𝑥𝑖 Manquehue Long grass Trevol

200 – 1180 690 7 2

1180 – 3140 2160 4 5

3140 – 5100 4120 6 4

5100 – 6080 5590 2 1

Más de 6080

0 0

I: Ingreso Miles de $

A: Antigüedad (años) Menos de 2 2 a 4 4 a 6 6 a 8 Total

H M H M H M H M

200 a 300 6 10 7 3 4 1 1 0 32

300 a 400 2 4 7 5 2 1 1 2 24

400 a 500 0 2 3 0 5 3 2 1 16

500 a 600 0 0 0 0 4 0 3 1 8

Total 8 16 17 8 15 5 7 4 80

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 12 Alejandro González Tapia – Ingeniería Civil en Minas

6.1) Construya un gráfico que permita comparar la distribución porcentual de los hombres y

de las mujeres según antigüedad.

6.2) Como la empresa ha tenido utilidades significativas, quiere compartir sus excedentes

con los empleados para lo cual entrega las siguientes propuestas:

- Propuesta A: Un reajuste del 10% de sus ingresos más un bono de 25 mil

pesos por empleado.

- Propuesta B: Un reajuste del 8% de sus ingresos más un bono de 32 mil pesos

por empleado.

6.2.1) ¿Cuál de estas dos propuestas generará una distribución de los ingresos más

homogénea?

6.2.2) Suponga que cada empleado elige libremente cualquiera de las dos opciones,

tomando en consideración aquella que le reporta mayor ingreso. ¿Qué

porcentaje de los empleados elegirán la propuesta A?

6.3) Todo empleado que se encuentre sobre el segundo quintil de la variable antigüedad

serán beneficiados con 5 días adicionales de vacaciones. Calcule la antigüedad mínima

que debe tener un trabajador para optar a este beneficio.

6.4) Para los hombres con una antigüedad de al menos dos años, con un sueldo de por lo

menos $400.000 ¿Cuál es la antigüedad media en la empresa?

6.1) Solución:

M H %ℎ𝑀 %ℎ𝐻 Menos de 2 8 16 17,02 48,49

2 a 4 17 8 36,17 24,24

4 a 6 15 5 31,91 15,15

6 a 8 7 4 14,90 12,12

Total 33 47

0

10

20

30

40

50

60

Menos de 2 2 a 4 4 a 6 6 a 8

Po

rcen

taje

Antigüedad

Distribución de la antigüedad por sexo

% de Hombre

% de Mujeres

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 13

6.2.1) Solución:

𝑆𝑥 = 100�̅� = 350

Definimos las variables a utilizar:

𝑤 = "Propuesta A" = 1,1 𝑥 + 25

𝑡 = "Propuesta B" = 1,1 𝑥 + 32

Luego, por propiedades obtenemos los resultados correspondientes.

𝑆𝑤 = 1,1 𝑆𝑥 = 110�̅� = 1,1 �̅� + 25 = 410

𝑆𝑡 = 1,1 𝑆𝑥 = 110

𝑡̅ = 1,1 �̅� + 32 = 417

𝐶𝑉(𝑤) = 26,82% 𝐶𝑉(𝑡) = 26,37%

Respuesta: Al comparar ambos coeficientes de variabilidad obtenidos, concluimos que la propuesta

B entrega una distribución levemente más homogénea que la propuesta A.

6.2.2) Solución: Tenemos que:

𝑤 = "Propuesta A" = 1,1 𝑥 + 25

𝑡 = "Propuesta B" = 1,1 𝑥 + 32

Luego, si 𝑤 = 𝑡, ambas opciones entregan el mismo ingreso, por lo tanto, tenemos la siguiente

igualdad:

1,1 𝑥 + 25 = 1,08 𝑥 + 32 → 𝑥 = 350

En seguida buscamos un 𝑝, por medio de la formula de percentil, tal que:

350 = 300 +100 ∙ (

80∙ 𝑝

100− 32)

24 → 𝑝 = 55%

Respuesta: El porcentaje de los empleados que elegirán la propuesta A corresponde a 55%, que

equivale a 36 empleados.

6.3) Solución: Sabemos por definición que el segundo Quintil, es lo mismo que decir el percentil

cuarenta, por lo que utilizaremos la fórmula de percentil, donde tenemos:

𝑃40 = 2 +2 ∙ (

80∙40

100− 24)

25= 2,64 𝑎ñ𝑜𝑠

Respuesta: La antigüedad mínima que debe tener un trabajador para poder optar al beneficio de los

cinco días adicionales de vacaciones es 2,64 años.

𝑥 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 $

𝑥𝑖 𝑛𝑖

200 a 300 250 32

300 a 400 350 24

400 a 500 450 16

500 a 600 550 8

n = 80

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 14 Alejandro González Tapia – Ingeniería Civil en Minas

7.- El número de llamadas telefónicas de larga distancia nacional, registradas por una empresa

distribuidora durante una hora de un día determinado, se resumen en la siguiente tabla. Los

registros se realizaron en horarios normales y se consideraron llamadas de, lo más, 3 minutos

de duración

Carrier Región Valor de la llamada (u.m)

[5 - 6] (6 - 8] (8 - 10] (10 - 20] Total

II 3 8 10 4 25

188 IV 7 9 10 4 30

X 3 7 5 5 20

II 4 3 9 6 22

171 IV 5 5 8 3 21

X 2 4 7 7 20

II 3 4 7 8 22

123 IV 7 4 4 5 20

X 6 7 4 3 20

Total 40 51 64 45 200

7.1) Clasifique las variables involucradas según nivel de medición y tamaño de recorrido e

indique la medida marginal de tendencia central más adecuada para el valor de la

llamada y para el carrier en la IV región.

7.2) ¿Qué porcentaje de llamadas son tales que superan al valor promedio de las llamadas

realizadas a través del carrier 171?

7.3) Al mes siguiente de haber efectuado este estudio, el valor de la llamada de larga

distancia del carrier 123, aumentó en un 2% más 1 u.m. por cada 3 minutos de duración.

¿En qué porcentaje disminuye (aumenta) la variabilidad del valor de la llamada al mes

siguiente?

7.1) Solución:

La medida marginal de tendencia central más adecuada para el valor de la llamada es Mediana,

debido a que la variable es Asimétrica.

𝑀𝑒 = 8 + 2 ∙ (

50∙200

100− 91

64) = 8,28 𝑢. 𝑚. 𝑀𝑜 = 𝐶𝑎𝑟𝑟𝑖𝑒𝑟 188

Variable Según Nivel de Medición Según Tamaño de Recorrido

Carrier Nominal Discreta

Región Nominal Discreta

Valor de llamada De Razón Continua

𝑦 = Valor de la llamada 𝑦𝑖 𝑛𝑖 𝑁𝑖 Carrier Región IV 𝑛𝑖

[5 – 6] 5,5 40 40 188 30

(6 – 8] 7 51 91 171 21

(8 – 10] 9 64 155 123 20

(10 – 20] 15 45 200

n = 200

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 15

7.2) Solución:

𝑡̅ = 9,53 𝑢. 𝑚.

Utilizando formula de percentil en la tabla de la pregunta a), tenemos:

9,53 = 8 + 2 ∙ (

𝑝∙200

100− 91

64) 𝑝 = 69,98% = 𝑃(𝑦 > 𝑡̅)

Por propiedad de complemento: 𝑃(𝑦 > 𝑡̅) = 100 − 𝑃(𝑦 ≤ 𝑡̅) = 30,02%

Respuesta: El porcentaje de llamadas que superan al valor promedio de las llamadas realizadas a

través del carrier 171 es igual al 30,02%

7.3) Solución:

𝑆𝑥 = 3,6596�̅� = 9,1612

𝐶𝑉(𝑥) = 0,3994

Sea: 𝑢 = “Valor de la llamada del Carrier 123 después del aumento del 2% más 1 u.m.”

𝑢 = 1,02 𝑥 + 1

Luego, para ahorrar cálculos utilizaremos propiedades:

�̅� = 1,02 �̅� + 1 → �̅� = 10,3444 𝑆𝑢 = 1,02 𝑆𝑥 → 𝑆𝑢 = 3,7327

→ 𝐶𝑉(𝑢) = 0,3608

Después, determinaremos el porcentaje con que disminuye o aumenta la variabilidad del valor de la

llamada del Carrier 123 después del aumento del 2% más una u.m.

% = (0,3994 − 0,3608) ∙ 100 = 3,86%

Respuesta: Luego del aumento del valor de la llamada del Carrier 123 correspondiente al 2% más

una unidad monetaria, el porcentaje con que DISMINUYÓ la variabilidad del valor de la llamada

corresponde al 3,86%.

𝑡 = Valor de la llamada del Carrier 171

𝑡𝑖 𝑛𝑖

[5 – 6] 5,5 11

(6 – 8] 7 12

(8 – 10] 9 24

(10 – 20] 15 16

n = 63

𝑥 = Valor de la llamada del Carrier 123

𝑥𝑖 𝑛𝑖

[5 – 6] 5,5 16

(6 – 8] 7 15

(8 – 10] 9 15

(10 – 20] 15 16

n = 62

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 16 Alejandro González Tapia – Ingeniería Civil en Minas

8.- Una gran empresa está constituida por tres sucursales: S1, S2 y S3. El Gerente General de

esta empresa solicita un estudio acerca de: el número de artículos defectuosos producidos

diariamente y cantidad diaria de materia prima elaborada, en cada una de estas sucursales.

Para cumplir lo solicitado por la gerencia general, se registró información en las tres

sucursales simultáneamente durante 90 días. La información resumida se presenta en la tabla

siguiente:

SUCURSAL N° ARTICULOS CANTIDAD DE MATERIA PRIMA ELABORADA (ton)

DEFECTUOSOS 5 – 15 15 - 25 25 - 35 35 - 45

S1

menos de 10 18 6 5 0

10 – 50 10 7 10 0

más de 50 5 7 22 0

S2

menos de 10 0 13 4 3

10 – 50 0 17 11 5

más de 50 0 8 19 10

S3

menos de 10 0 12 4 0

10 – 50 0 20 20 0

más de 50 0 5 29 0

8.1) Construya un gráfico que le permita comparar las cantidades diarias de materia prima

elaborada en las sucursales S1 y S3. ¿Qué puedes concluir?

8.2) La Gerencia de Producción de esta empresa, debe estar atenta a que no haya mucha

variabilidad en la cantidad diaria de materia prima elaborada (ya que si es mucha puede

haber problemas de almacenamiento y si es poca podría no satisfacer la demanda).

Esta Gerencia declara “estado de alerta” siempre que el coeficiente de variación de la

cantidad de materia prima elaborada sea superior a un 30%. Basándose en la

información presentada, declararía Ud. “estado de alerta” en la sucursal S1.

8.3) En que % de los días, la cantidad de materia prima elaborada por S2 supera al percentil

75 de la cantidad de materia prima elaborada por S1?

8.1) Solución:

0

10

20

30

40

50

60

70

0 10 20 30 40

hi%

Cantidad de Materia Prima Elaborada (ton)

S1

S2

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 17

Respuesta: A la conclusión que llegamos es que ambas distribuciones son asimétricas, ya que al

contraponerlas estas no coinciden.

8.2) Solución:

𝑆𝑥 = 8,81�̅� = 20,44

𝐶𝑉(𝑥) =8,81

20,44∙ 100 = 43,10%

Respuesta: Según los datos obtenidos concluimos que la Gerencia debería declarar “estado de

alerta”, ya que el coeficiente de variación de la cantidad de materia prima elaborada es igual a 43,1%,

lo que es superior al 30%.

8.3) Solución:

𝑥 = CMPE (ton)

𝑆1

𝑛𝑖

𝑆1

𝑁𝑖

𝑥 = CMPE (ton)

𝑆2

𝑛𝑖

𝑆2

𝑁𝑖

5 – 15 33 33 5 – 15 0 0

15 – 25 20 53 15 – 25 38 38

25 – 35 37 90 25 – 35 34 72

35 – 45 0 0 35 – 45 18 90

Lo primero es calcular 𝑃75 de S1, lo que se hace por medio de la fórmula de percentil:

𝑃75 = 25 +10 ∙ (

90∙75

100− 53)

37= 28,92

Luego, ese resultado es igualado a la fórmula de percentil aplicada a la sucursal S2, lo que queda de

la siguiente manera:

28,92 = 25 +10 ∙ (

90∙𝑝

100− 38)

34 𝑝 = 57%

Finalmente, por propiedad de complemento obtenemos que el resultado es el 43%.

Respuesta: En el 43% de los días, la cantidad de materia prima elaborada por S2 supera al percentil

75 de la cantidad de materia prima elaborada por S1.

𝑥 = CMPE (ton) 𝑆1

𝑛𝑖

𝑆3

𝑛𝑖

𝑆1

ℎ𝑖%

𝑆3

ℎ𝑖%

5 – 15 33 0 36,7 0

15 – 25 20 37 22,2 41,1

25 – 35 37 53 41,9 58,9

35 – 45 0 0 0 0

𝑥 = CMPE (ton)

𝑥𝑖 𝑆1

𝑛𝑖

5 – 15 10 33

15 – 25 20 20

25 – 35 30 37

35 – 45 40 0

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 18 Alejandro González Tapia – Ingeniería Civil en Minas

9.- El responsable en control industrial de la empresa “CLR”, somete a un control de fiabilidad

110 baterías idénticas de celulares y anota su duración (tiempo hasta que se descarga), en

horas. La información obtenida se presenta a continuación:

𝒙 ∶ Duración (en horas) N° de baterías

200 – 300 4

300 – 400 25

400 – 500 60

500 – 600 19

600 – 700 2

9.1) Si se quiere garantizar a las baterías que tengan una duración de a lo más: �̅� − 𝟏. 𝟓 𝑺(𝒙)

¿Qué porcentaje de las baterías serán garantizadas?

9.2) La empresa “ADA”, de la competencia tiene en el mercado baterías de similares

condiciones, al tomar una muestra de baterías de igual tamaño se obtuvo que la

duración media de 400 hrs y una varianza de 6400 (hrs)2. Para competir con la empresa

“CLR”, la empresa “ADA” decide utilizar una tecnología que permite aumentar la

duración de cada batería en 70 hrs.

Después de aplicada la nueva tecnología, ¿En cuál de estas empresas resulta más

homogénea la duración de las baterías?

9.1) Solución: Lo primero es determinar el valor de "�̅� − 1.5 𝑆(𝑥)", lo que se desprende de la tabla que

adjunta el ejercicio.

�̅� = 440,9091𝑆(𝑥) = 78,4546

→ �̅� − 1.5 𝑆(𝑥) = 440,9091 − 1.5 ∙ 78,4546 = 323,2272

Luego este valor es reemplazado en la fórmula de percentil, de la siguiente manera:

323,2272 = 300 + 100 ∙(

110∙𝑝

100− 4)

25 → 𝑝 = 8,9152

Respuesta: El porcentaje de las baterías que serán garantizadas es del 8,9153%

9.2) Con los datos que fueron expuestos en el enunciado, hemos creado una tabla para poder tener

una mejor visión de la información dada:

Empresa n �̅� 𝑆(𝑥) CV

CLR 110 440,9091 78,4546 0,1779

ADA (después de la modificación) 80 470 80 0,1702

Respuesta: Las baterías de la empresa ADA después de la modificación tienen duración más

homogénea que las baterías de la empresa CLR.

(*) 10.- La siguiente tabla corresponde a la distribución de una muestra de cubos de cemento,

clasificados según: porcentaje de silicato dicálcico en el cemento (X), porcentaje de

aluminioferrito tetracálcico (Z) (ambos en relación con el peso total de la mezcla a partir de la

cual se preparó el cemento) y el calor desprendido en el fraguado (Y), en calorías por gramos

de cemento.

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Alejandro González Tapia – Ingeniería Civil en Minas Página 19

𝒙: Porcentaje silicato dicálcico

Y: Calor desprendido (cal/gr) 70 – 85

85 – 100

100 – 115

Z < 15% Z ≥ 15% Z < 15% Z ≥ 15% Z < 15% Z ≥ 15%

5 – 20 0 0 0 0 5 4

20 – 35 0 3 3 4 6 1

35 – 50 1 4 4 1 0 0

50 – 60 3 3 1 1 0 0

Total 4 10 8 6 11 5

10.1) Utilizando las distribuciones del calor desprendido en el fraguado, de las muestras con

aluminioferrito tetracálcico inferior al 15% y de las que tienen a lo menos un 15%.

10.1.1) Explique cual distribución es más homogénea.

10.1.2) Compare gráficamente las dos distribuciones de los cubos de cemento en

estudio, según calor desprendido en el fraguado. Interprete dicho gráfico.

10.2) Suponiendo que existe asociación, lineal entre el calor desprendido en el fraguado y el

porcentaje de silicato dicálcico, evalúe con la medida adecuada si ésta es fuerte o débil y

en qué sentido lo es.

10.3) En estas muestras de cemento, también se midió el porcentaje de silicato tricálcico (W)

encontrando que su vinculación con el calor desprendido tiene la siguiente relación:

𝐘𝐢 = 𝟓𝟓, 𝟖 + 𝟎, 𝟖 𝐖𝐢 . Determine el porcentaje de los cubos de cemento que en la muestra

tienen un porcentaje de silicato tricálcico superior a su promedio más una desviación

estándar (aproxime los cálculos al cuarto decimal)

10.1.1) Solución:

𝐶. 𝑉. (𝑌 𝑍 < 15)⁄ =11,4726

97,0652= 0,1182

𝐶. 𝑉. (𝑌 𝑍 ≥ 15)⁄ =12,4642

88,9286= 0,1402

Respuesta: Como C.V. (Y/ Z < 15) < C.V. (Y/ Z ≥ 15), la distribución del calor desprendido en el

fraguado de las muestras son alumioderrito tetracálcico inferior al 15% es más homogénea.

10.1.2) Solución:

𝑌𝑖 Z < 15 Z ≥ 15

62,5 0 0

77,5 17,39 47,62

92,5 34,78 28,57

107,5 47,83 23,81

122,5 0,00 0,00

𝑌𝑖 𝑁°/ 𝑍 < 15 𝑁° / 𝑍 ≥ 15

77,5 4 10

92,5 8 6

107,5 11 5

TOTAL 23 21

Po

rce

nta

jes

Mu

est

rale

s

Calor desprendido (cal/gr)

1. Estadística Descriptiva – Ejercicios Resueltos

ANÁLISIS ESTADÍSTICO

Página 20 Alejandro González Tapia – Ingeniería Civil en Minas

Respuesta: Ambas distribuciones son asimétricas (contrapuestas) teniendo menor desprendimiento

de calor las con mayor porcentaje de aluminioferrito tetracálcico.

10.2) Solución: La medida más adecuada es el Coeficiente de correlación: r = - 0,7405, y los datos

utilizados fueron los siguientes:

𝑦

𝑥 77,5 92,5 107,5 TOTAL

12,5 0 0 9 9

27,5 3 7 7 17

42,5 5 5 0 10

55 6 2 0 8

TOTAL 14 14 16 44

Respuesta: La asociación lineal que tienen entre el calor desprendido en el fraguado y el porcentaje

de silicato dicálcico es inversa moderada, lo que se averiguo por medio del Coeficiente de correlación

de Pearson.

10.3) Solución: Utilizando la información que nos brinda el ejercicio podemos definir la siguiente expresión:

𝑌𝑖 = 55,8 + 0,8 𝑊𝑖 → 𝑊𝑖 =𝑌𝑖

0,8− 69,75

Luego de esto por medio de propiedades determinamos la media y desviación estándar

𝑀(𝑊) =93,1818

0,8− 69,75 = 46,7273 % 𝑆(𝑊) =

12,51

0,8= 15,6375 %

Reemplazando:

𝑊𝑖 = 𝑀(𝑊) + 𝑆(𝑊) = 62,3648 → 𝑌𝑖 = 55,8 + 0,8 ∙ 62,3648 = 105,6918 (𝑐𝑎𝑙/𝑔𝑟)

Finalmente, por fórmula de percentil, tenemos:

105,6918 = 100 +15

16(

𝑝 ∙ 44

100− 28) → 𝑝 = 77,4347%

Respuesta: El porcentaje de los cubos de cemento que en la muestra tienen un porcentaje de silicato

tricálcico superior a su promedio más una desviación estándar es igual al 22,5653%