Estadística Aplicada-Vol 1

35
Estadística Aplicada a las Ciencias Sociales Patricio Alcaíno Martínez Derechos Reservados 2012 Cálculo e interpretación de estadígrafos Estadística Descriptiva básica VOLUMEN - 1 PROBLEMAS Y CASOS RESUELTOS Presentación y análisis básico de datos

description

Set de ejercicios, problemas y casos de estadística descriptiva de nivel básico, aplicados a las Ciencias Sociales. Organización e interpretación de datos, cálculo de estadígrafos.

Transcript of Estadística Aplicada-Vol 1

Page 1: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales

Patricio Alcaíno Martínez Derechos Reservados

2012

• Cálculo e interpretación de estadígrafos

• Estadística Descriptiva básica

VOLUMEN - 1 PROBLEMAS Y CASOS RESUELTOS

• Presentación y análisis básico de datos

Page 2: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

2

Palabras iniciales Estimados usuari@s:

• Este material que pongo a su disposición, está elaborado a partir de casos e investigaciones reales en distintos ámbitos de las Ciencias Sociales, los que han sido recreados para ajustarlos a un contexto educativo. Por ello, los datos, información y conclusiones presentadas no son necesariamente válidas en contextos reales.

• Este volumen está dirigido a tratar el tema de la presentación y análisis básico de

datos y el cálculo e interpretación de estadígrafos. El lector deberá manejar los conceptos y procedimientos elementales de Estadística descriptiva y exhibir competencia en el cálculo de razones, proporcionalidad y tanto por ciento.

• Para trabajar con este material el usuario deberá hacer uso de la calculadora,

demostrando capacidad para utilizar efectivamente la función estadística para cálculo de la media y desviación estándar.

• Este material tiene Derechos Reservados y su uso está permitido solo con fines

educativos.

Atentamente;

Patricio Alcaíno Martínez

Revisión: Catalina Salfate, Socióloga. Santiago de Chile, Abril de 2012.

Page 3: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

3

Índice de casos

Caso 1: Población, índice de masculinidad e índice urbano/rural. Página 4. Se ejercitan los cálculos e interpretación de razones en una población humana. Caso 2: Embarazos no planificados. Página 8. A partir del fenómeno de los embarazos no planificados, se trabaja una completa estadística con variable continua. Caso 3: Violación a los DDHH. Página 11. El fenómeno de la violación de los DDHH en Chile da pie para trabajar con variables organizadas en tablas de contingencia, trabajando una completa estadística con variable continua. Caso 4: Clima laboral. Página 16. Breve estadística con variable cualitativa ordinal. Caso 5: Peso de recién nacidos. Página 17. Breve estadística con variable numérica no agrupada. Caso 6: Estudio de población. Página 18. Una completa estadística descriptiva que combina una variable continua con dos variables dicotómicas. Caso 7: Dieta para adelgazar. Página 25. Breve estadística con variable cualitativa nominal. Caso 8: Índice de masculinidad. Página 27. A partir de un gráfico dado, se interpreta y se obtiene información, analizando una serie de afirmaciones dadas. Caso 9: Enfermedades crónicas en adultos mayores. Página 29. Se analiza un caso con variable discreta, derivando datos e información a partir de un gráfico dado. Caso 10: Gasto en medicamentos. Página 31. Caso orientado a la interpretación de percentiles, en el contexto de un gasto mensual en medicamentos. Caso 11: Concentración de plomo en la sangre. Página 33. Estadísticas de variable continua, orientado a la interpretación de un histograma, al cálculo e interpretación de percentiles.

Page 4: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

4

Caso 1: Población, índice de masculinidad e índice urbano/rural En cierta comuna del Sur, con una población de 28.450 habitantes, se da un índice urbano/rural 0,75 y un índice de masculinidad 115,4. Esta comuna ha tenido especial interés de las autoridades de salud porque se ha detectado que 8 de cada mil habitantes presentan alteraciones genéticas atribuibles a la actividad minera de la zona, localizándose el 62,5% de los casos en las zonas urbanas. 1.1. ¿Qué indica este índice urbano/rural? 1.2. ¿A cuánto asciende la población rural de la comuna? 1.3. ¿Qué % de la población es urbana? 1.4. ¿A cuántas personas asciende la población femenina en esta comuna? 1.5. ¿Qué % de la población es masculina? 1.6. ¿Cuántas personas están afectadas de la alteración genética en esta comuna? 1.7. ¿Cuántas personas de las zonas rurales presentan la alteración genética en esta comuna? 1.8. Construya una tabla de contingencia que muestre la población de la comuna según si presenta o no alteración genética según zona de residencia. Solución: 1.1. ¿Qué indica este índice urbano/rural? Este índice significa que hay 0,75 habitantes urbanos por cada uno rural. Amplificando por cien, indica que por cada 75 habitantes urbanos, hay 100 rurales, o bien 3 urbanos por cada 4 rurales. En resumen, indica que hay más población rural que urbana. 1.2. ¿A cuánto asciende la población rural de la comuna? En la comuna se da una relación de 3 habitantes urbanos por cada 4 rurales. Es decir, por cada 7 habitantes hay 4 rurales (y 3 urbanos). Llevando a proporción:

ruralesxhabts450.28

rurales4habts7

=

Despejando x:

==7

450.28·4x 16.257.

R: En la comuna, la población rural llega a 16.257 habitantes. 1.3. ¿Qué % de la población es urbana? Población total = 28.450 habitantes Población urbana = 28.450 - 16.257 = 12.193 Llevando a %:

== 100·450.28193.12P 42,86%

R: En la comuna, el 42,86% de la población es urbana.

Page 5: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

5

Otra solución: Según el índice Urbano/Rural, por cada 7 habitantes hay 3 urbanos. Llevando a proporción:

== 100·73P 42,86%

1.4. ¿A cuántas personas asciende la población femenina en esta comuna? El índice de masculinidad de la comuna indica que hay 115,4 hombres por cada 100 mujeres. Es decir que por cada 215,4 habitantes 100 son mujeres (y 115,4 son hombres). Llevando a proporción:

mujeresxhabts450.28

mujeres100habts4,215

=

Despejando x:

==4,215450.28·100x 13.208 mujeres.

R: En la comuna, la población de mujeres llega a 13.208. 1.5. ¿Qué % de la población es masculina? Población total = 28.450 habitantes Población masculina = 28.450 - 13.208 = 15.242. Llevando a %:

== 100·450.28242.15P 53,57%

R: En la comuna, el 53,57% de la población es masculina. Otra solución: Según el índice de masculinidad, por cada 215,4 habitantes hay 115,4 hombres. Llevando a proporción:

== 100·4,2154,115P 53,57%

1.6. ¿Cuántas personas están afectadas de la alteración genética en esta comuna?

Según el dato, estas son 8 de cada mil.

Llevando a proporción:

afectadosxhabts450.28

afectados8habts000.1

=

Page 6: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

6

Despejando x:

==000.1

450.28·8x 228 afectados.

R: En la comuna, la población de afectados llega a 228. 1.7. ¿Cuántas personas de las zonas rurales presentan la alteración genética en esta comuna? Según el dato, el 62,5% de los afectados corresponden a zonas urbanas. Esto significa que en las zonas rurales esta proporción alcanza al 37,5%.

El 37,5% de 228 afectados es:

=⋅

1005,37228 86.

R: De los 288 afectados, 86 habitantes rurales presentan la alteración genética en esta comuna. 1.8. Construya una tabla de contingencia que muestre la población de la comuna según si presenta o no alteración genética según zona de residencia. Para el caso de las variables asociadas, o supuestamente asociadas, se suele colocar la variable independiente en las filas y la dependiente en columnas. Así, en este caso, si se sospecha que la alteración genética es dependiente de la zona de residencia, la tabla quedaría así:

Población según presenta o no alteración genética y zona de residencia Zona Presentan la alteración genética Total

Sí No Urbana Rural Total

Para completar la tabla se usarán los datos dados y otros calculados anteriormente:

• Del enunciado del caso se sabe que el total de la población es 28.450. • De 1.2 se sabe que la población rural llega a 16.257 habitantes. • De 1.6 se obtiene que el total de afectados es 228. • De 1.7 se obtiene que de los 228 afectados, 86 son rurales.

Insertando estos datos en la tabla se llega a lo siguiente:

Page 7: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

7

Población según presenta o no alteración genética y zona de residencia Zona Presentan la alteración genética Total

Sí No Urbana Rural 86 16.257 Total 228 28.450

El resto de la tabla se completa por diferencias, llegando finalmente a la siguiente tabla de frecuencias:

Población comunal según alteración genética y zona de residencia

Zona Presenta alteración genética

Total Sí No

Urbana 142 12.051 12.193 Rural 86 16.171 16.257 Total 228 28.222 28.450

Page 8: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

8

Caso 2: Embarazos no planificados El siguiente cuadro muestra la edad de las mujeres que presentan embarazos no planificados, según un estudio muestral realizado en cierta región del norte de Argentina: Mujeres con embarazos no planificados por edad

A partir de este dato: 2.1. Calcule la edad promedio de las mujeres que presentan embarazos no planificados en este estudio, su desviación estándar y su coeficiente de variación. 2.2. Trace un gráfico de caja y bigotes de la edad de las mujeres que presentan embarazos no planificados en este estudio. 2.3. Sobre la base de los cuartiles, construya cinco afirmaciones respecto de la muestra estudiada. 2.4. ¿Qué % de la muestra tiene menos de 18 años? Solución: Primeramente se trasladan los datos a una tabla, a la cual se le agrega la columna de límites reales, la de marcas de clase y una de frecuencias porcentuadas acumuladas.

Edad Edad Xm % % acum 12 a 14 años 12 – 15 13,5 3 3 15 a 19 años 15 – 20 17,5 57 60 20 a 24 años 20 – 25 22,5 33 93 25 a 29 años 25 – 30 27,5 7 100 Total - - 100 -

2.1. Calcule la edad promedio de las mujeres que presentan embarazos no planificados en este estudio, su desviación estándar y coeficiente de variación. Los estadísticos pedidos se pueden calcular en la calculadora, tomando los % como si fuesen frecuencias absolutas. Media = 19,73 años; Desviación Estándar = 3,28 años; CV = 16,6%.

Edad %

12 a 14 años 3 15 a 19 años 57 20 a 24 años 33 25 a 29 años 7

Total 100

Page 9: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

9

2.2. Trace un gráfico de caja y bigotes de la edad de las mujeres que presentan embarazos no planificados en este estudio. Para trazar un gráfico de caja, se requieren los cuartiles y el mínimo y máximo valor de la variable. Ya que se trabaja con % acumulados, el cuartil 1 está en el 25%, el cuartil 2 en el 50% y el cuartil 3 en el 75%. Entonces:

Q1 = 15 + 5(25 – 3)/57 = 16,9 años Q2 = 15 + 5(50 – 3)/57 = 19,1 años Q3 = 20 + 5(75 – 60)/33 = 22,3 años

Ya calculados los cuartiles, con sus valores se traza el gráfico de caja y bigotes. Helo aquí: 2.3. Afirmaciones Considerando el concepto y definición de los tres cuartiles, se pueden derivar afirmaciones como las siguientes:

• El 25% de las encuestadas son menores de 16,9 años de edad • La cuarta parte de las mujeres con embarazo no planificado, tienen entre 12 y

16,9 años. • El 50% de las de las mujeres encuestadas con embarazo no planificado, son

mayores de 19,1 años de edad • El 25% de las encuestadas son mayores de 22,3 años de edad. • La mitad de las encuestadas tienen entre 19,1 y 30 años.

12 14 16 18 20 22 24 26 28 30

Años

Edad de mujeres con embarazo no planificado

Page 10: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

10

2.4. ¿Qué % de la muestra tiene menos de 18 años? Utilizando la tabla de frecuencias acumuladas:

Edad % % acum 12 – 15 3 3 15 – 20 57 60 20 – 25 33 93 25 – 30 7 100

- 100 - Lo que se pregunta es qué % acumula la tabla de frecuencia desde los 12 a los 18 años. Esto se resuelve con el concepto de percentil. Entonces:

57)3P(5

1518−

+=

Donde P representa el porcentaje acumulado hasta x = 18 años. Despejando P:

57

)3P(51518

−=−

)3P(5573 −=⋅

3P5

171−=

P32,34 =+ 2,37P = %

R: El 37,2% de las mujeres de la muestra tienen menos de 18 años.

Page 11: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

11

Caso 3: Violación a los DDHH La tabla siguiente muestra el resultado de una encuesta en relación a los Derechos Humanos durante el gobierno militar en Chile, realizada con el objeto de conocer la opinión de la ciudadanía chilena al respecto.

PREGUNTA: ¿Cree usted que las altas autoridades civiles del gobierno militar tenían conocimiento que se violaban los Derechos Humanos, o no tenían conocimiento? Grupo Etario (años) Total

18 - 24 25 - 39 40 - 59 60 – 79 Sí, tenían conocimiento 167 835 No, no tenían conocimiento 111 66 Total 345 237 178

Muestra: 1.125 personas de 29 ciudades de más de 40 mil habitantes entre I y X región seleccionadas al azar. Con los datos dados: 3.1. En la muestra total, calcule la edad media y su desviación estándar. 3.2. En los que opinan que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos, calcule la edad mediana y cuartiles 1 y 3. Interprete el valor numérico de cada uno de ellos, en el marco del caso. 3.3. En los que opinan que las autoridades NO tenían conocimiento de la violación de los derechos humanos, dibuje un gráfico de caja. 3.4. Calcule los siguientes porcentajes:

3.4.1. De los que opinan que SÍ tenían conocimiento, ¿qué % tiene 40 o más años? 3.4.2. De los que opinan que NO tenían conocimiento, ¿qué % tiene menos de 25 años? 3.4.3. De los que tienen menos de 60 años, ¿qué % cree que las autoridades NO tenían conocimiento? 3.4.4. De los que tienen 40 años o más, ¿qué % cree que las autoridades SÍ tenían conocimiento? 3.4.5. De la muestra, ¿qué % son personas menores de 40 años que creen que las autoridades SÍ tenían conocimiento?

Solución: En primer lugar se completa la tabla de frecuencias, aplicando sumas y diferencias:

Conocimiento Grupo Etario (años) Total 18 – 24 25 – 39 40 – 59 60 – 79

Sí, tenían conocimiento 302 254 167 112 835 No, no tenían conocimiento 43 111 70 66 290 Total 345 365 237 178 1.125

Page 12: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

12

3.1. En la muestra total, calcule la edad media y su desviación estándar. Para calcular la media de las edades y su desviación estándar, previamente se organizan los datos en una tabla adecuada. Se tiene la precaución de expresar los límites reales y de calcular las marcas de clase (Xm) de cada intervalo.

Años Xm Casos 18 – 25 21,5 345 25 – 40 32,5 365 40 – 60 50 237 60 – 80 70 178 Total - 1.125

Ingresando los datos a la calculadora, resulta:

7,38x = años, y; =σ 16,9 años.

3.2. En los que opinan que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos, calcule la edad mediana y cuartiles 1 y 3. Interprete el valor numérico de cada uno de ellos, en el marco del caso. Para calcular los cuartiles de las edades, previamente se organizan los datos en una tabla de frecuencia. Se tiene la precaución de expresar los límites como límites reales y de calcular la columna de frecuencias acumuladas:

Las autoridades SÍ tenían conocimiento. Años Casos Acum.

18 - 25 302 302 25 – 40 254 556 40 – 60 167 723 60 - 80 112 835 Total 835

Mediana:

254)3025,417(1525Me −

+= =31,8 años.

• El 50% de los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, tiene, a lo más 31,8 años.

Cuartil 1:

302)075,208(7181Q −

+= =22,8 años.

• El 25% de los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, tiene, a lo más 22,8 años.

Page 13: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

13

Entre los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, el 75% tiene, a lo menos, 22,8 años.

Cuartil 3:

167)55625,626(20

403Q−

+= = 48,4 años.

• Entre los encuestados que opinan que las autoridades sí tenían conocimiento de la

violación de los derechos humanos en Chile, el 25% tiene, a lo menos, 48,4 años. • El 75% de los encuestados que opinan que las autoridades sí tenían conocimiento

de la violación de los derechos humanos en Chile, tiene, a lo más 48,4 años. 3.3. En los que opinan que las autoridades NO tenían conocimiento de la violación de los derechos humanos, dibuje un gráfico de caja. Para construir un gráfico de caja de las edades de este segmento, previamente deben ser calculados los tres cuartiles. Reorganizando los datos en una tabla de frecuencias, se tiene lo siguiente:

Las autoridades NO tenían conocimiento. Años Casos Acum.

18 - 25 43 43

25 – 40 111 154

40 – 60 70 224 60 - 80 66 290

290

=⇒4

2901Q 72,5, lo que ubica al cuartil 1 en el segundo intervalo.

111)435,72(15251Q −

+= =29,0 años.

=⇒2

2902Q 145, lo que ubica al cuartil 2 en el segundo intervalo.

111)43145(15

252Q−

+= =38,8 años.

=⋅

⇒429033Q 217,5, lo que ubica al cuartil 3 en el tercer intervalo.

70)1545,217(20403Q −

+= =58,1 años.

Además de estos valores, de acuerdo a la tabla de frecuencias, se tomará 18 años como el mínimo y 80 años como el máximo.

Page 14: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

14

El gráfico de caja queda de la siguiente manera:

Opinan que las autoridades no tenían conocimiento, según edad.

3.4. Calcule los siguientes %. Haciendo uso de la tabla de frecuencias se obtienen las cantidades requeridas.

3.4.1. De los que opinan que SÍ tenían conocimiento, ¿qué % tiene 40 o más años? De los 835 que opinan que las autoridades SÍ tenían conocimiento, 167 + 112 = 279 tienen 40 o más años.

Llevando a %:

== 100·835279P 33,4%

R: De los que opinan que SÍ tenían conocimiento de la violación de los derechos humanos, el 33,4% tiene 40 o más años.

3.4.2. De los que opinan que NO tenían conocimiento, ¿qué % tiene menos de 25 años? De los 290 que opinan que NO tenían conocimiento, 43 tienen menos de 25 años.

Llevando a %:

== 100·29043P 14,8%

R: De los que opinan que las autoridades NO tenían conocimiento de la violación de los derechos humanos, el 14,8% tiene menos de 25 años. 3.4.3. De los que tienen menos de 60 años, ¿qué % cree que las autoridades NO tenían conocimiento? De los 345 + 365 + 237 = 947 que tienen menos de 60 años, 224 creen que las autoridades NO tenían conocimiento de los hechos.

Llevando a %:

== 100·947224P 23,7%

R: De los que tienen menos de 60 años, el 23,7% cree que las autoridades NO tenían conocimiento de la violación de los derechos humanos.

Page 15: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

15

3.4.4. De los que tienen 40 años o más, ¿qué % cree que las autoridades SÍ tenían conocimiento? De los 237 + 178 = 415 que tienen 40 años o más, 167 + 112 = 279 cree que las autoridades SÍ tenían conocimiento.

Llevando a %:

== 100·415279P 67,2%

R: De los que tienen 40 años o más, el 67,2% cree que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos.

3.4.5. De la muestra, ¿qué % son personas menores de 40 años que creen que las autoridades SÍ tenían conocimiento? De la muestra de 1.125 personas, 302 + 254 = 556 son menores de 40 años que creen que las autoridades SÍ tenían conocimiento.

Llevando a %:

== 100·125.1

556P 49,4%

R: El 49,4% de la muestra son personas menores de 40 años que creen que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos.

Page 16: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

16

Caso 4: Clima laboral Calcule la moda, la mediana y la media en los siguientes datos, que corresponden a opinión de trabajadores acerca del clima laboral en la empresa en la cual trabajan, siendo: B = Bueno; R = regular; M = Malo. Los datos son: M; R; R; B; M; R; B; M; M Solución: 4.1. Moda: Malo

La opinión más generalizada es que el clima laboral en la empresa es Malo, con 4 observaciones sobre un total de 9.

4.2. Mediana:

Ordenando: M; M; M; M; R; R; R; B; B; con n = 9 Ubicación: (9 + 1)/2 = 5. La mediana es el 5º valor.

Mediana: Me = Regular

• Al menos el 50% de los encuestados opina que el clima laboral en la empresa es de malo a regular.

• Al menos el 50% de los encuestados opina que el clima laboral en la empresa es de regular a bueno.

4.3. Media: No se puede calcular, ya que las observaciones no son valores numéricos.

Page 17: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

17

Caso 5: Peso de recién nacidos Calcule la moda, la mediana y la media en los siguientes datos, que corresponden al peso de 12 recién nacidos, en Kg. Peso; 2,340; 3,450; 4,560; 2,350; 1,860; 6,120;

3,570; 3,450; 4,250; 3,580; 2,560; 5,110. Solución: 5.1. Mo = 3,450Kg. El peso más frecuente de encontrar en la muestra es 3,450Kg. 5.2. Mediana: Ordenando los pesos de menor a mayor:

1,860; 2,340; 2,350; 2,560; 3,450; 3,450; 3,570; 3,580; 4,250; 4,560; 5,110: 6,120.

Por ser n par, quedan dos valores al centro de la distribución. Por lo tanto:

2

570,3450,3Me += = 3,510 Kg.

Esto es: la mitad de los recién nacidos pesan más de 3,510 Kg.

5.3. Media: Ingresando los datos a la calculadora, resulta: =x 3,600 Kg.

Esto es: el peso promedio de los recién nacidos es de 3,600 Kg.

Page 18: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

18

Caso 6: Estudio de población Se ha de estudiar la población de una pequeña comuna de la novena región, para lo cual, primeramente se la caracteriza por grupo de edad, área de residencia y sexo. Población por grupo de edad, área de residencia y sexo.

Grupo de edad (años)

Área urbana Área rural hombres mujeres hombres mujeres

0 – 10 216 189 115 145 10 – 20 315 322 98 126 20 – 30 412 445 112 135 30 – 40 512 485 188 201 40 – 50 602 655 145 144 50 – 60 418 512 102 155 60 – 70 125 221 46 54 70 – 80 88 132 24 46

Calcule: 6.1. ¿Qué % de la población es rural? 6.2. La proporción de la población menor de 20 años. 6.3. El índice de feminidad en el área urbana. 6.4. El índice de masculinidad en la población rural de 40 años o más. 6.5. La edad media de los hombres del área urbana y su desviación estándar. 6.6. La edad mediana en las mujeres del área rural. Interprete su valor. 6.7. ¿Qué % representa la población rural de 50 años o más, respecto de la población total? 6.8. Calcule la razón urbano/rural en la población total de la comuna. 6.9. Dibuje un gráfico de caja de la edad de los hombres rurales. 6.10. Dibuje un histograma porcentuado que muestre la distribución de mujeres urbanas según edad. 6.11. Dibuje un gráfico que muestre la distribución de la población según sexo. 6.12. ¿Qué % de la población tiene menos de 6 años? Solución: Para facilitar la interpretación de la tabla, se calcularán algunos totales básicos. Población por grupo de edad, área de residencia y sexo.

Edad (años) URBANA

Total U RURAL

Total R TOTAL H M H M

0 – 10 216 189 405 115 145 260 665 10 – 20 315 322 637 98 126 224 861 20 – 30 412 445 857 112 135 247 1.104 30 – 40 512 485 997 188 201 389 1.386 40 – 50 602 655 1.257 145 144 289 1.546 50 – 60 418 512 930 102 155 257 1.187 60 – 70 125 221 346 46 54 100 446 70 – 80 88 132 220 24 46 70 290

TOTAL 2.688 2.961 5.649 830 1.006 1.836 7.485

Page 19: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

19

6.1. ¿Qué % de la población es rural? La población total llega a 7.455 personas, de las cuales 1.836 viven en zonas rurales. Llevando a %:

== 100·485.7836.1P 24,53%

R: El 24,53% de la población es rural.

6.2. La proporción de la población menor de 20 años.

Sumando toda la población menor de 20 años, da 1.526 Llevando a %:

== 100·485.7526.1P 20,39%

R: El 20,39%de la población menor de 20 años.

6.3. El índice de feminidad en el área urbana.

En el área urbana hay: Mujeres = 2.961 Hombres = 2.688 El índice de feminidad es:

== 100·688.2961.2IF 110,16 mujeres por cada 100 hombres.

R: En el área urbana hay 110,16 mujeres por cada 100 hombres.

6.4. El índice de masculinidad en la población rural de 40 años o más.

Hombres rurales de 40 años o más = 317 Mujeres rurales de 40 años o más = 399 El índice de masculinidad en ese segmento es:

== 100·399317IM 79,45 hombres por cada 100 mujeres.

R: En la población rural de 40 años o más hay 79,45 hombres por cada 100 mujeres.

Page 20: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

20

6.5. La edad media de los hombres del área urbana y su desviación estándar. Para los efectos, se calcula la marca de clase de cada intervalo.

Hombres del área urbana por grupos de edad (años). Años Xm Casos 0 – 10 5 216 10 – 20 15 315 20 – 30 25 412 30 – 40 35 512 40 – 50 45 602 50 – 60 55 418 60 – 70 65 125 70 – 80 75 88

2.688

Ingresando datos a la calculadora:

Edad media = 36,77 años Desviación estándar = 17,61 años

6.6. La edad mediana en las mujeres del área rural. Interprete su valor. Para los efectos, se calcula la frecuencia acumulada.

Mujeres del área rural, según edad (años). Años Casos Acum. 0 – 10 145 145 10 – 20 126 271 20 – 30 135 406 30 – 40 201 607 40 – 50 144 751 50 – 60 155 906 60 – 70 54 960 70 – 80 46 1006

1006

Mediana ⇒ n/2 = 1.006/2 = 503. La mediana se ubica en el cuarto intervalo.

201)406503(1030Me −

+= = 34,8 años

• El 50% de las mujeres rurales tiene a lo más 34,8 años.

Page 21: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

21

6.7. ¿Qué % representa la población rural de 50 años o más, respecto de la población total?

Población total = 7.485 Población rural de 50 años o más = 427

Llevando a %:

== 100·485.7

427P 5,70%

R: La población rural de 50 años o más representa el 5,70% respecto de la población total.

6.8. Calcule la razón urbano/rural en la población total de la comuna.

Población urbana = 5.649 Población Rural = 1.836

Razón Urbana/Rural = 836.1649.5

≈3

R: En la comuna, hay 3 personas rurales por cada una rural.

6.9. Dibuje un gráfico de caja de la edad de los hombres rurales. Para los efectos, se calculan los cuartiles:

Hombres rurales, según edad (años) Años Casos Acum 0 – 10 115 115 10 – 20 98 213 20 – 30 112 325 30 – 40 188 513 40 – 50 145 658 50 – 60 102 760 60 – 70 46 806 70 – 80 24 830

830

Cuartil 1 ⇒ 0,25 n = 0,25 · 830 = 207,5. El cuartil 1 se ubica en el segundo intervalo.

98)1155,207(1010Q1

−+= = 19,4 años

Page 22: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

22

Mediana ⇒ 0,5 n = 0,5 · 830 = 415. La mediana se ubica en el cuarto intervalo.

188)325415(1030Q1

−+= = 34,8 años

Cuartil 3 ⇒ 0,75 n = 0,75 · 830 = 622,5. Este cuartil se ubica en el quinto intervalo.

145)5135,622(1040Q1

−+= = 47,6 años

Gráfico:

6.10. Dibuje un histograma porcentuado que muestre la distribución de mujeres urbanas según edad. El histograma requiere los límites reales de cada intervalo para el eje de las absisas y los % en el eje de las ordenadas. Mujeres urbanas según edad, en años.

Años Casos % 0 – 10 189 6,4 10 – 20 322 10,9 20 – 30 445 15,0 30 – 40 485 16,4 40 – 50 655 22,1 50 – 60 512 17,3 60 – 70 221 7,5 70 – 80 132 4,5

2.961 100

Page 23: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

23

El gráfico resultante es el siguiente:

6.11. Dibuje un gráfico que muestre la distribución de la población según sexo.

Total mujeres = 3.967 (53%) Total hombres = 3.518 (47%)

Por ser una variable cualitativa, sirve un gráfico de barras como el siguiente:

Población según sexo. Sexo Casos %

Hombres 3.518 47

Mujeres 3.967 53

Total 7.485 100 6.12. ¿Qué % de la población tiene menos de 6 años? Para realizar este cálculo, se aplicará el concepto de percentil. Por eso se requiere una tabla con frecuencia acumuladas: Población comunal, según edad, en años.

Años Casos Acumulado 0 – 10 665 665 10 – 20 861 1526 20 – 30 1.104 2630 30 – 40 1.386 4016 40 – 50 1.546 5562 50 – 60 1.187 6749 60 – 70 446 7195 70 – 80 290 7485

7.485

Page 24: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

24

La edad de 6 años se encuentra en el primer intervalo.

665

)0F(1006 −+=

La F indica la frecuencia de aquellos que tienen menos de 6 años. Despejando:

665

)0F(106 −=

F106656 =⋅ F103990 =

F10990.3

=

F = 399 personas tienen menos de 6 años.

Llevando a %:

== 100·485.7

399P 5,33%

R: El 5,33% de esta población tiene menos de 6 años.

Page 25: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

25

Caso 7: Dieta para adelgazar Un estudio consultó a una muestra de mujeres mayores de 18 años de la región metropolitana si seguían o no alguna dieta para adelgazar. La tabla siguiente muestra los datos obtenidos: ¿Sigue alguna dieta para adelgazar? Mujeres mayores de 18 años según siguen o no dieta para adelgazar. Número de casos.

Respuesta Nº casos Sí 194 No 297 No responde 37

7.1. Calcule la columna de %. Aproxime correctamente a un decimal. 7.2. Construya un gráfico que muestre adecuadamente los resultados. Solución: 7.1. Calcule la columna de %. Aproxime correctamente a un decimal. Se agrega una columna para los % y una fila para los totales.

En cada celda de % se calcula el % que representa la frecuencia absoluta respecto del total muestra. En la celda correspondiente al % Sí, el cálculo es:

== 100·528194P 36,7%

Para la celda % No, el cálculo es:

== 100·528297P 56,3%

Para la celda % No responde, el cálculo es:

== 100·52837P 7,0%

Se verifica que la suma es 100%.

La tabla queda de la siguiente manera:

¿Sigue alguna dieta para adelgazar?

Respuesta Nº casos % Sí 194 36,7 No 297 56,3 No responde 37 7,0 Total 528 100

Page 26: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

26

7.2. Construya un gráfico que muestre adecuadamente los resultados. El gráfico adecuado para el tipo de variable es el de barras horizontales o verticales y el gráfico circular. En este caso se presenta un gráfico de barras verticales.

Sí No NR ¿Sigue alguna dieta para adelgazar?

Porc

enta

je (%

)

60 55 50 45 40 35 30 25 20 15 10 5 0

56,3

36,7

7,0

Page 27: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

27

Caso 8: Índice de Masculinidad El Índice de Masculinidad (IM) es un indicador demográfico definido como el número de hombres por cada 100 mujeres. El gráfico de la figura muestra la evolución del IM en cierto país latinoamericano entre los años 1960 y 2000.

Indique, en función de los datos del gráfico: F si la afirmación es falsa, V si es verdadera y N si no es posible determinar su verdad o falsedad a partir de los datos del gráfico. 8.1. . . . . . En 1960 había más mujeres que hombres.

8.2. . . . . . Entre 1970 y 1980 las mujeres pasan a ser mayoría.

8.3. . . . . . En el año 2000, los hombres representan aproximadamente el 52,6% de la

población.

8.4. . . . . . En 1960, aproximadamente el 45,5% de la población es femenina.

8.5. . . . . . Entre 1960 y 1970 disminuyó el número de hombres en el país.

8.6. . . . . . Hacia 1970 el 52,4% de la población es masculina.

8.7. . . . . . Entre 1960 y 2000 aumentó la cantidad de mujeres en el país.

Solución: 8.1. . . . . . En 1960 había más mujeres que hombres. (F). Según el gráfico, el IM ese año es 120, lo que indica una proporción de 120 hombres por cada 100 mujeres. Es decir, mayoría hombres. Por lo tanto, la afirmación es falsa. 8.2. . . . . . Entre 1970 y 1980 las mujeres pasan a ser mayoría. (V). Según el gráfico, en esos años el IM pasa de 110 a 97, lo que indica que la proporción de hombres, siendo dominante en 1970, pasa a ser minoría en 1980. Por lo tanto, la afirmación es verdadera. 8.3. . . . . . Hacia el año 2000, los hombres representan aproximadamente el 52,6% de la población. (F) Hacia el año 2000, el IM indica 90 hombres por cada 100 mujeres. Es decir, los hombres son minoría, por lo que no es posible que representen más del 50%. Por lo tanto, la afirmación es falsa.

Page 28: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

28

8.4. . . . . . En 1960, aproximadamente el 45,5% de la población es femenina. (V) En 1960 el IM indica 120 hombres por cada 100 mujeres. Esto es, que de cada 220 personas, 100 son mujeres.

Calculando a partir de esto el % de mujeres: =100·220100 45,5%.

Por lo tanto, la afirmación es verdadera. 8.5. . . . . . Entre 1960 y 1970 disminuyó el número de hombres en el país. (N). Entre 1960 y 1970 lo que bajó es la razón entre hombres y mujeres. Esto puede haber ocurrido por:

• Aumento en la cantidad de mujeres, manteniéndose constante la cantidad de hombres

• Disminución de la cantidad de hombres, manteniéndose constante la cantidad de mujeres

• Aumento en la cantidad de mujeres y disminución de la cantidad de hombres • Disminución de hombres y mujeres, con disminución más rápida en los primeros • Aumento de hombres y mujeres, con aumento más rápido en las mujeres

Por lo tanto, a partir solo del gráfico, no se puede precisar qué es lo que ocurrió. 8.6. . . . . . Hacia 1970 el 52,4% de la población es masculina. (V) En 1970 el IM es 110, lo que indica 110 hombres por cada 100 mujeres. Esto significa, a la vez, que por cada 210 personas, hay 110 hombres y 100 mujeres.

Llevando esto a % de hombres: =100·210110 52,4%.

Por lo tanto, la afirmación es verdadera. 8.7. . . . . . Entre 1960 y 2000 aumentó la cantidad de mujeres en el país. (N) Lo que sube o baja es la razón entre hombres y mujeres y no es posible precisar, a partir solo del gráfico, cuál de las dos cantidades es la que varía o cómo estas lo hacen.

Page 29: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

29

Caso 9: Enfermedades crónicas en adulto mayor Se investigan algunos aspectos de la salud del adulto mayor. El siguiente gráfico corresponde a la distribución de una muestra de adulto mayor según número de enfermedades crónicas que reportaron a los investigadores. A partir del gráfico: 9.1. Calcule el número medio de enfermedades crónicas reportadas en la muestra, su desviación estándar y coeficiente de variación. 9.2. Calcule el número mediano de enfermedades crónicas reportadas en la muestra. 9.3. Calcule el número modal de enfermedades crónicas reportadas en la muestra. 9.4. De los que reportaron al menos 1 enfermedad crónica, ¿qué % reportó más de 2? 9.5. Calcule la probabilidad de encontrar en esta muestra personas que hayan reportado 2 ó 3 enfermedades crónicas. Solución: 9.1. Calcule el número medio de enfermedades crónicas reportadas en la muestra. Se llevan los datos del gráfico a una tabla de frecuencias:

N° enfermedades N° de casos 0 28 1 32 2 20 3 12 4 8

Total 100 Llevando los datos a la calculadora, resulta: =x 1,4 enfermedades =σ 1,23 enfermedades

=CV =⋅1004,1

23,1 87,9%

32 28 24 20 16 12 8 4 0

Nº de casos

Adultos mayores según Nº de enfermedades crónicas reportadas

0 1 2 3 4

Page 30: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

30

9.2. Calcule el número mediano de enfermedades crónicas reportadas en la muestra. Para calcular la mediana, se genera una columna de frecuencias acumuladas:

N° enfermedades N° de casos F acum 0 28 28 1 32 60 2 20 80 3 12 92 4 8 100

Total 100 - Por tratarse de una variable discreta, no se aplica la fórmula de la mediana para variables en intervalos, sino que se debe usar la definición de mediana. La mediana es el valor de la variable que está entre el 50° y el 51° valor de la variable. Como desde el valor 29° hasta el 60°, x = 1, entonces ese es el valor de la mediana. R: Por lo tanto, el número mediano de enfermedades crónicas en el adulto mayor es 1. 9.3. Calcule el número modal de enfermedades crónicas reportadas en la muestra. La moda es el valor de la variable con mayor frecuencia. En este caso es x = 1. R: Por lo tanto, el número modal de enfermedades crónicas en el adulto mayor es 1. 9.4. De los que reportaron al menos 1 enfermedad crónica, ¿qué % reportó más de 2? Reportaron al menos 1 enfermedad crónica: 72 adultos mayores Reportaron más de 2 enfermedades crónicas: 12 + 8 = 20 adulto mayor. Llevando a %:

=⋅= 1007220P 27,8%.

R: De los adultos mayores que reportaron al menos 1 enfermedad crónica, el 27,8% reportó más de 2. 9.5. Calcule la probabilidad de encontrar en esta muestra personas que hayan reportado 2 ó 3 enfermedades crónicas. Total de casos: 100 Reportaron 2 ó 3 enfermedades crónicas: 20 + 12 = 32 adulto mayor Aplicando la fórmula de Laplace:

P = 10032 = 0,32.

R: la probabilidad de encontrar en esta muestra personas que hayan reportado 2 ó 3 enfermedades crónicas es 0,32.

Page 31: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

31

Caso 10: Gasto en medicamentos Se realiza un estudio con personas de ambos sexos con enfermedades crónicas, acerca del monto del gasto mensual en medicamentos. El estudio permitió calcular los siguientes estadígrafos, en $miles: Gasto mínimo = M$ 5,8 Gasto máximo = M$ 124,6 Gasto decil 2 = M$ 15,7 Gasto percentil 45 = M$ 38,4 Gasto cuartil 3 = M$ 75,6 Gasto percentil 95 = M$ 115,2 10.1. Construya 5 afirmaciones respecto de la muestra estudiada. Solución: 10.1. Afirmaciones Las afirmaciones son enunciados demostrables empíricamente. En el contexto del caso, se harán afirmaciones demostrables con los valores de los estadígrafos dados. En primer lugar, con los datos dados es conviene construir un diagrama como el siguiente: Los valores de la variable en el eje X y los % en cada segmento del gráfico, se obtienen de las definiciones de los estadígrafos dados. Por ejemplo, de la definición del decil 2 = M$15,7 se entiende que el 20% de la muestra gasta mensualmente menos de esa cantidad en medicamentos y el 80%, más de esa cantidad. Se puede verificar en el gráfico el 20% bajo M$15,7 y sobre esa cantidad 25% + 30% + 20% + 5% = 80%. De acuerdo al percentil 45, el 45% gasta a lo más M$38,4 en medicamentos al mes, porcentaje que en el diagrama corresponde a 20% + 25%. Y así sucesivamente. Con este diagrama ya es posible construir muchas afirmaciones, tales como las siguientes:

• El 20% de las personas encuestadas gasta, a lo más, $15.700 mensuales en medicamentos.

• El 25% de las personas encuestadas gasta mensualmente entre $15.700 y $38.400 en medicamentos.

• De las personas estudiadas, el 55% gasta mensualmente entre $15.700 y $75.600 en medicamentos.

5,8 124,6 115,2

5% M$

15,7 38,4

30% 25% 20%

75,6

20%

Gasto mensual en medicamentos (M$)

Page 32: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

32

• El 55% de las personas de la muestra gasta, al mes, a lo menos, $38.400 en medicamentos.

• El 50% de los encuestados gasta mensualmente entre $38.400 y $115.200 en medicamentos.

• El 5% de las personas de la muestra gasta más de $115.200 en medicamentos al mes.

• El 20% de los encuestados gasta entre $75.600 y $115.200 al mes en medicamentos.

• De los encuestados, el 30% gasta entre $38.400 y $75.600 al mes en medicamentos.

• Etc.

Page 33: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

33

Caso 11: Concentración de plomo en la sangre Un estudio realizado con una muestra de recién nacidos en cierto barrio industrial de Montevideo, arrojó el siguiente gráfico de la concentración de plomo en la sangre, medido en microgramos por decilitro de sangre ( dl/gµ ).

A partir del gráfico, determine lo siguiente: 11.1. Calcule el promedio de concentración de plomo en la sangre en la muestra, su desviación estándar y coeficiente de variación. 11.2. Para efectos de dar información pública, se desea determinar la concentración máxima de plomo en la sangre del 5% inferior y la concentración mínima del 5% superior de la muestra. 11.3. Calcule la prevalencia de concentración de plomo en la sangre por sobre 10 dl/gµ en la muestra. Solución: Para los efectos de los cálculos solicitados, se trasladarán los datos del gráfico a una tabla de frecuencias:

Concentración Xm Nº F acum 1 – 3 2 7 7 3 – 5 4 11 18 5 – 7 6 17 35 7 – 9 8 15 50

9 – 11 10 19 69 11 – 13 12 9 78 13 – 15 14 5 83 15 – 17 16 3 86

Total 86

Page 34: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

34

11.1. Calcule el promedio de concentración de plomo en la sangre en la muestra, su desviación estándar y coeficiente de variación. Con la columna de marcas de clase (Xm) y sus frecuencias absolutas de la tabla, se ingresan los datos a la calculadora, obteniendo los siguientes resultados:

=x 8,093 ≈8,1 dl/gµ =σ 3,556 ≈3,6 dl/gµ

CV= 9,43100093,8556,3

=⋅ %

11.2. Para efectos de dar información pública, se desea determinar la concentración máxima de plomo en la sangre del 5% inferior y la concentración mínima del 5% superior de la muestra. La concentración máxima de plomo en la sangre del 5% inferior equivale al percentil 5:

5P ⇒ 5% de 86 = 4,3. Este percentil se ubica en el primer intervalo de la tabla.

=5P =−

+7

)03,4(21 2,2 dl/gµ .

El 5% de la muestra tiene, a lo más, una concentración de 2,2 dl/gµ de plomo en la sangre.

La concentración mínima de plomo en la sangre del 5% superior equivale al percentil 95:

95P ⇒ 95% de 86 = 81,7. Este percentil se ubica en el intervalo número 7 de la tabla.

=95P =−

+5

)787,81(213 14,5 dl/gµ .

El 5% de la muestra tiene, a lo menos, una concentración de 14,5 dl/gµ de plomo en la sangre.

11.3. Calcule la prevalencia de concentración de plomo en la sangre por sobre 10 dl/gµ en la muestra. La prevalencia es el % de la muestra que presenta dicha característica. Para calcular este porcentaje, aplicando el concepto de percentil, se calculará previamente el % que está bajo el valor 10 dl/gµ .

=−

+19

)50F(29 10;

Page 35: Estadística Aplicada-Vol 1

Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.

35

Donde F es la frecuencia acumulada hasta x = 10 dl/gµ . Despejando:

1019

)50F(29 =−

+

91019

)50F(2−=

119

)50F(2=

21950F =−

5,59502

19F =+= recién nacidos.

Es decir, de un total de 86 recién nacidos de la muestra, 59,5 presentan menos de 10

dl/gµ de plomo en la sangre. Por lo tanto, los que están sobre ese valor de plomo son 86 – 59,5 = 26,5 recién nacidos. Llevando a porcentaje:

=⋅= 10086

5,26P 30,8%.

R: La prevalencia de concentración de plomo en la sangre por sobre 10 dl/gµ en la muestra llega al 30,8% de los recién nacidos.