INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su...

18
INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490 SOLEDAD – ATLÁNTICO. Página 1 de 18 Versión 1.0 PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017 1 GUÍA N° 1 ÁREA: matemáticas ASIGNATURA: Estadística GRADO:9 DOCENTE: María Teresa Ospino PERIODO: I IH : 20 horas EJE TEMÁTICO: PROPORCIONALIDAD Competencias Ciudadana para evaluar en el área: Se comunica a través del diálogo constructivo con los otros Considera las consecuencias de los propios actos Cuidar de sí mismo y de los demás respetando las diferencias de sus compañeros DESEMPEÑO: Conjetura acerca del resultado de un experimento aleatorio usando nociones básicas de probabilidad. Resuelve y formula problemas a partir de un conjunto de datos presentados en tablas y/o diagramas NÚCLEOS TEMÁTICOS: Medidas de dispersión Datos no agrupados (rango, varianza, desviación media y estándar Datos agrupados (rango, varianza, desviación media y estándar) comparación entre dos o más datos correlación, diagrama de tallo y hojas Medidas de posición: Cuartiles Deciles Percentiles Representación gráfica (diagrama de caja) INDICADOR(ES) DE DESEMPEÑO(S) Conoces calcula e interpreta medidas de dispersión para datos agrupados y no agrupados Elabora correctamente diagramas de tallo y hojas de acuerdo a los datos proporcionados Establece conclusiones de comportamiento de un diagrama de correlación Realiza inferencias simples a partir de información estadística de distintas fuentes. Conoce, Calcula e interpreta medidas de posición Utiliza herramientas estadística para construir un diagrama de caja Interpreta y hace conjeturas de un diagrama de caja SITUACIÓN(ES) PROBLEMA(S): Investigadores de diversas áreas enfrentan el problema de analizar y comprender un conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos, organizarlos y resumirlos para obtener de ellos la mayor cantidad de información posible. Una bióloga que realiza uno de sus estudios en un lago está pesando todas las ranas que pueda encontrar, que habiten este lago. ¿Cómo puede ordenar estos datos? ¿Qué información crees que es relevante para su estudio? ¿Qué información puede obtener al analizar los datos obtenidos? ¿Cómo puede presentar en forma gráfica la información obtenida? FASE MOTIVACIONAL: “Llegará el día en el que el pensamiento estadístico será una condición tan necesaria para la convivencia eficiente como la Capacidad de leer y escribir. Herbert. George. Wells (1866-1946)” La estadística es un área de las matemáticas, que permite recolectar, organizar e interpretar la información asociada a diferentes actividades, del quehacer humano de forma sistemática, los resultados obtenidos, a partir de los métodos estadísticos, son aplicados prácticamente en todas las áreas científicas y en todas aquellas donde es necesario fundamentar la toma de decisiones. Sabías que:

Transcript of INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su...

Page 1: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 1 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

1

GUÍA N° 1

ÁREA: matemáticas ASIGNATURA: Estadística GRADO:9

DOCENTE: María Teresa Ospino PERIODO: I IH : 20 horas

EJE TEMÁTICO: PROPORCIONALIDAD

Competencias Ciudadana para evaluar en el área: Se comunica a través del diálogo constructivo con los otros

Considera las consecuencias de los propios actos Cuidar de sí mismo y de los demás respetando las diferencias de sus compañeros

DESEMPEÑO:

Conjetura acerca del resultado de un experimento aleatorio usando nociones básicas de probabilidad. Resuelve y formula problemas a partir de un conjunto de datos presentados

en tablas y/o diagramas

NÚCLEOS TEMÁTICOS: Medidas de dispersión

Datos no agrupados (rango, varianza, desviación media y estándar Datos agrupados (rango, varianza, desviación media y estándar)

comparación entre dos o más datos correlación, diagrama de tallo y hojas

Medidas de posición: Cuartiles

Deciles Percentiles

Representación gráfica (diagrama de caja)

INDICADOR(ES) DE DESEMPEÑO(S)

Conoces calcula e interpreta medidas de dispersión para datos agrupados y no agrupados

Elabora correctamente diagramas de tallo y hojas de acuerdo a los datos proporcionados

Establece conclusiones de comportamiento de un diagrama de correlación Realiza inferencias simples a partir de información estadística de distintas fuentes.

Conoce, Calcula e interpreta medidas de posición

Utiliza herramientas estadística para construir un diagrama de caja Interpreta y hace conjeturas de un diagrama de caja

SITUACIÓN(ES) PROBLEMA(S):

Investigadores de diversas áreas enfrentan el problema de analizar y comprender un

conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos, organizarlos y resumirlos para obtener de ellos la

mayor cantidad de información posible. Una bióloga que realiza uno de sus estudios en un lago está pesando todas las ranas

que pueda encontrar, que habiten este lago. ¿Cómo puede ordenar estos datos?

¿Qué información crees que es relevante para su estudio? ¿Qué información puede obtener al analizar los datos obtenidos?

¿Cómo puede presentar en forma gráfica la información obtenida?

FASE MOTIVACIONAL:

“Llegará el día en el que el pensamiento estadístico será una condición tan necesaria para la convivencia eficiente como la

Capacidad de leer y escribir. Herbert. George. Wells (1866-1946)”

La estadística es un área de las matemáticas, que permite recolectar, organizar e interpretar la información asociada a diferentes actividades, del quehacer humano de

forma sistemática, los resultados obtenidos, a partir de los métodos estadísticos, son aplicados prácticamente en todas las áreas científicas y en todas aquellas donde es

necesario fundamentar la toma de decisiones.

Sabías que:

Page 2: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 2 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

2

Aunque parezca increíble, existen doctores en papa. Especialistas que han estudiado la

composición de este fruto, para combatir las enfermedades o plagas que la atacan, sin utilizar químicos, y, además explorar otras posibilidades que generan riquezas por medio

de nuevas variantes. O sabías que:

La probabilidad de ser mujer Como quizás ya sepas, la probabilidad de nacer niño o niña es la misma. Esto implica que hay aproximadamente el mismo número de hombres y

mujeres en el mundo. ¿Sabes a qué se debe que estas probabilidades sean iguales? Las cadenas de ADN forman cromosomas que determinan muchos rasgos del ser humano,

pero hay dos cromosomas en particular, llamados X y Y, que determinan el sexo de un hijo.

Las mujeres tienen dos cromosomas de tipo X y transmiten al embrión uno u otro con la

misma probabilidad. Los hombres, por su parte, tienen un cromosoma X y uno Y; también le aportan al embrión uno u otro con la misma probabilidad. El resultado es una pareja

de cromosomas que podrá ser XX o XY. Si se da una pareja XX será una niña y si es XY será un niño.

Diagnóstico:

1. Redondea los siguientes números decimales a la décima siguiente y explica cómo lo hiciste:

a. 45,687 b. 142,856

c. 0,6757 d. 63,354

e. 23,7323 2. Resuelve los siguientes ejercicios con números decimales

a. 7,4 + 78,0 b. 4,070 – 0,303

c. 37,4 + 9,6 – 0,9 – (0,7 · 1,045) d. 6,20 · 4,30

e. 3 · (7,8 – 32,16) + (36,43 / 0,18) 3. Los siguientes datos corresponden al contenido de nicotina, en miligramos, de once

cigarrillos: 1,09 1,74 1,58 2,1 1,64 1,79 1,37 1,75 1,92 2,03 1,47

a. Calcula la media del contenido de nicotina. b. Calcula la mediana del contenido de nicotina.

4. Dada la siguiente tabla de frecuencias correspondiente a los colores favoritos de 60 niños. Realizar el gráfico de barras

5. Con la tabla de datos correspondiente al porcentaje de estudiantes que perdieron

esa área, realizar un diagrama circular

Área

perdida

Frecuencia

porcentual

Español 30%

Matemáticas 20%

Sociales 15%

Ciencias N 10%

Otras 5%

No pierden 20%

Total 100%

Colores Favoritos

Frecuencia absoluta

Azul 15

Verde 20

Blanco 5

Rojo 4

Amarillo 16

Total 60

Page 3: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 3 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

3

Glosario

Bioestadística: aplicación de la estadística a la biología o a la medicina

Censo: estudio de una población en el cual se tienen en cuenta varios aspectos de ella Combinación: dado un conjunto de N elementos, cualquier subconjunto no ordenado

de tamaño n de los objetos se llama combinación Conjunto: reunión o colección de objetos, llamados elementos, con una o más

características específicas en común Deciles: valores que dividen el conjunto de datos en diez partes iguales cada parte

representa el 10% del total Diagrama: representación gráfica de un conjunto de datos

Encuesta: Serie de preguntas que se hace a muchas personas para reunir datos o para

detectar la opinión pública sobre un asunto determinado. Espacio muestral: consiste en el conjunto de todos los posibles resultados de un

experimento aleatorio Estadística: Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de

ellos, inferencias basadas en el cálculo de probabilidades. Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en común, para

poder llegar a conclusiones a partir de los datos numéricos extraídos. Evento: un evento o suceso es un subconjunto de un espacio muestral

Experimento aleatorio: es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir o

reproducir el resultado exacto de cada experiencia particular. Frecuencia: Número de veces que aparece, sucede o se realiza una cosa durante un

período o un espacio determinados. Muestra: Conjunto de cosas, personas o datos elegidos al azar, que se consideran

representativos del grupo al que pertenecen y que se toman para estudiar o determinar

las características del grupo. Ojiva: La ojiva es un polígono frecuencial acumulado

Percentiles: es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se

encuentra un porcentaje dado de observaciones en un grupo de observaciones. Permutación: es la variación del orden o de la disposición de los elementos de un

conjunto Población: es un conjunto de sujetos o individuos con determinadas características

demográficas, de la que se obtiene la muestra o participantes en un estudio estadístico interno a la que se quiere extrapolar los resultados de dicho estudio

Probabilidad: es una medida de la certidumbre asociada a un suceso o evento futuro y suele expresarse como un número entre 0 y 1 (o entre 0% y 100%).

Promedio: es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado

Variable: es el conjunto de valores que puede tomar cierta característica de la

población sobre la que se realiza el estudio estadístico

FASE COGNITIVA

Recordemos que:

La media de un conjunto de datos se calcula sumando todos los datos y luego

dividiendo por el número de observaciones. La frecuencia acumulada de una clase es la suma de las frecuencias de esa clase

y de todas las clases anteriores.

Page 4: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 4 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

4

La media, para datos agrupados en k clases, se calcula usando la siguiente

expresión:�̅� =∑ 𝑥𝑖×𝑓1

𝑛𝑖=1

∑ 𝑓𝑖𝑛𝑖=1

La mediana para datos agrupados se calcula mediante el método de interpolación. El proceso consiste en ir acumulando la población al porcentaje correspondiente

(50%) y relacionarlo con los datos que corresponden al estudio. La clase modal de un conjunto de datos agrupados es el intervalo con mayor

frecuencia

Actividad 1.

Objetivo: reforzar conocimientos previos

Conforma grupos de trabajo de 5 integrante y demuestra tus conocimientos previos a través de la siguiente situación:

Proyecto

La asociación de padres de familia de su colegio va a fabricar manillas para vender en la tienda escolar en hora de descanso. Con el objetivo de no desperdiciar material y

optimizar los costos, necesitan saber, cuál es el largo adecuado para la fabricación de las manillas; si los estudiantes les gusta la idea; cuanto están dispuestos a pagar por

las manillas; cuál es motivo que les gustaría para las manillas y otras variables más.

a. Seleccione una muestra de 50 estudiantes de su grado

b. Defina los parámetros del estudio: Qué objetivo tiene su estudio

Cuál es la población Cuál es la muestra

Qué variables se estudiaran en la muestra escogida

c. A través de una tabla de frecuencias y gráficos estadísticos presente en forma

organizada los datos que recogiste de tus variables de estudio, encuentra la media, la mediana y la moda de cada uno de tus variables de estudio

d. Escriba tres conclusiones generales que se puedan plantear teniendo en cuenta el

proceso realizado

e. Suponga que después de realizar el estudio, la decisión sobre la venta de las manillas es su responsabilidad. ¿Cuál sería su decisión?

f. Escribir un informe en donde explique la decisión

Medidas de dispersión

Son parámetros que sirven para medir que tan dispersos están los datos. La idea clave es medir el grado de separación de los datos con respecto a la media. Entre estas

parámetros tenemos: Rango, Desviación, Varianza, Y Desviación Estándar

Rango, Desviación, Varianza, Y Desviación Estándar (Datos no agrupados)

Page 5: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 5 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

5

Rango: corresponden a la longitud o ancho que abarcan los datos es la diferencia entre

el dato mayor DM y el dato menor dm. Cuando el rango de los datos es pequeño se dice que la variabilidad o dispersión del conjunto es baja y viceversa.

Pero su valor se ve alterado cuando hay un dato extremada mente grande o extremada mente pequeño

Ejemplo1:

La junta directiva de los equipos de futbol de la ciudad decidió comprar el pase de un jugador para ocupar la posición de delantero, para tal fin el empresario dueño de los

pases prestará a los dos jugadores y mostrara la cantidad de goles que han anotado durante la 5 últimas temporadas, el empresario presentó la siguiente tabla

Jugador 1 18 16 14 17 20

Jugador 2 30 20 14 4 17

Al calcular el promedio de goles de cada jugador obtenemos que: Jugador 1 �̅� = 17

Jugador 2 �̅� = 17

Los dos jugadores tienen un promedio de rendimiento igual; para decidir que jugador

van a contratar, la junta directiva analiza la regularidad de cada uno de los candidatos en a anotación de los goles.

El jugador 1 en cada una de las temporadas anotó un número similar de goles.

El jugador 2 en la primera temporada anotó muchos goles y en la cuarta anotó muy pocos.

Teniendo en cuenta el análisis el jugador 2 es más irregular que el jugador 1, por ello la junta decide contratar al jugador 1.

Para este ejemplo específico los rangos correspondiente a cada jugador son: Jugador 1 20 -14 = 6

Jugador 2 30 – 4 = 26 Se puede ver que el intervalo para el jugador 1 es menor que para el jugador 2, por lo

tanto el jugador 1 es mucho más regular que el jugador 2

Grafica de dispersión de los datos

Ejemplo 2: El empleado de la tienda escolar debe reportar en una planilla el número de fotocopias

que pide cada uno de los estudiantes que usa el servicio, los resultados de las primeras dos semanas sin incluir el domingo fueron:

Número de copias 5 12 15 9 20 1 15 79 21 2 3 10

El promedio de fotocopias por estudiante es �̅� = 16; el rango es 79-1=78 copias. Es

decir, la variable es muy dispersa y hay diferencias grandes entre los datos; por esta razón es necesario establecer otros criterios que midan la dispersión.

Una alternativa es comparar cada uno de los datos con respecto a la media y

determinar esta distancia. Una alternativa es la gráfica de dispersión

Desviación La desviación de un dato, es la distancia que hay entre este valor y la media. La

desviación del i-ésimo dato es 𝑑𝑖 = 𝑥𝑖 − 𝑋

Page 6: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 6 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

6

la desviación de los datos del número de fotocopias se muestra a continuación

Número de copias 5 12 15 9 20 1 15 79 21 2 3 10

Desviación -11 -4 -1 -7 4 -15 -1 63 5 -14 -13 -6

Una desviación negativa significa que, el dato está por debajo de la media y una

positiva que está por encima, como el promedio es el punto de equilibrio de los datos la suma de las desviaciones debe ser cero. Por esta razón se debe considerar una

medida que incluya estos valores y que no se anule, para ello se calculan los cuadrados de las desviaciones, bajo el principio que si una desviación es grande su cuadrado será

grande.

Desviación media: es la media de los valores absolutos de las desviaciones

La varianza

Que se denota por 𝑺𝟐, de un conjunto de n datos, es el promedio de los cuadrados de

las desviaciones de las observaciones respecto de su media. Este resultado será cero

sólo si todos sus datos son iguales

Entonces, si queremos resumir el comportamiento de la venta semanal de salchichas

del almacén de Aldo, podemos decir que tiene una media de 55 paquetes y una varianza de 497,7… ¿Qué le falta a esta afirmación?

Dado que al calcular la varianza se consideran las desviaciones al cuadrado, su unidad

corresponde a la de las observaciones, pero al cuadrado, es decir, en este caso, la

afirmación correcta es: “La venta semanal de salchichas del almacén de Aldo tiene una media de 55 paquetes y

una varianza de 497,7 paquetes cuadrados.” Pero esto dificulta la adecuada interpretación de los resultados.

Por ello, se usa otra medida de dispersión

La Desviación Estándar

Denotada por 𝑺 , definida por √ 𝑺𝟐2

Es decir, la desviación estándar es la raíz cuadrada

de la varianza. La ventaja de utilizar la desviación estándar como medida de dispersión es que está

expresada en las mismas unidades que las observaciones.

Page 7: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 7 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

7

Para el caso de la venta de salchichas, sabemos que la varianza es de 497,7 paquetes

cuadrados. Luego, la desviación estándar es de 22,3 paquetes

Actividad 2

En tu cuaderno

6. Una empresa de embotellamiento de jugos cuenta con dos máquinas de llenado

de botellas. El ingeniero de producción cree que una de las maquinas no está llenando las botellas con los 375 c.c. que se ofrecen en la etiqueta. Para confirmar

su sospecha decide tomar una muestra de 10 botellas llenas en cada una de las

máquinas y medir su contenido. Los resultados se muestran a continuación:

Máquina 1 380 380 370 371 368 378 373 379 376 375

Máquina 2 405 365 340 420 360 410 370 320 350 410

a. Usando la media, determinar si una de las maquinas necesita reparación

b. Si el ingeniero determina que el promedio se cumple con las especificaciones, pero aun así puede pedir mantenimiento para una de las máquinas.

Usa la desviación estándar para determinar para cuál de ellas debe hacerlo

Recuerda que:

La marca de clase (𝑀𝑖)

Corresponde al punto medio de una clase.

La media para datos agrupados en una tabla de frecuencias con k clases se

calcula:

Page 8: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 8 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

8

Rango, Desviación, Varianza, Y Desviación Estándar (Datos agrupados )

Leamos el siguiente Ejemplo 1:

Los estándares de calidad de una fábrica de baterías exigen que la duración de una

batería sea, en promedio, de 30 horas, pero además estipulan que al menos el 75% de la producción debe estar entre 20 y 40 horas de duración. Con el fin de analizar si las

baterías cumplen las normas exigidas, Pedro estudia el comportamiento de 40 baterías obteniendo la siguiente información:

Clase (horas de duración) 𝑓𝑖 (frecuencia) 𝑀𝑖 (marca de clase)

[20,25) 10 22,5

[25,30) 9 27,5

[30,35) 10 32,5

[35,40) 7 37,5

[40,45) 4 42,5

Analicemos: ¿Cuánto duran, en promedio, las baterías observadas?

¿Satisface los estándares de la fábrica?, ¿cómo lo sabes?

¿Cómo se puede decidir si también cumple con los estándares de calidad

exigidos? ¿Qué otros cálculos puede realizar Pedro para validar estos criterios?

¿Cuál es el rango de este conjunto de datos?, ¿cuál es su varianza?

Page 9: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 9 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

9

Y entonces la desviación estándar es 6,23 horas.

¿Qué puedes concluir?

Una regla es que, en general, al menos un 75% de las observaciones se encuentran en un intervalo cuyo límite inferior es el valor de la media menos el doble de la desviación

estándar y cuyo límite superior es el valor de la media más el doble de la desviación estándar. Para el ejemplo:

[(30,8 – 2 · 6,23), (30,8 + 2 · 6,23)] = [18,34, 43,26] Es decir, al menos el 75% de las baterías producidas en la fábrica donde Pedro trabaja

están entre 18,34 y 43,26 horas de duración. En conclusión, aunque en términos de la duración promedio, la fábrica cumple la

norma, respecto a la variabilidad no la cumple, porque es menor de la exigida, pues el

límite inferior del intervalo es 18,34 horas, menor que el 20 exigido.

Ejemplo 2

Page 10: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 10 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

10

Actividad 3

1. En la fábrica donde trabaja Pedro se realizaron ajustes en la producción, con el fin

de garantizar el cumplimiento de los estándares de calidad. Después de un tiempo, se hizo un nuevo seguimiento a 40 baterías, obteniendo la siguiente información

Clase (horas de duración) 𝑓𝑖 (frecuencia) 𝑀𝑖 (marca de clase)

[20,25) 2 22,5

[25,30) 9 27,5

[30,35) 15 32,5

[35,40) 10 37,5

[40,45) 4 42,5

a. Calcula la media, la varianza y la desviación estándar y escribe tus conclusiones.

b. ¿Se cumple ahora con las exigencias de calidad de la fábrica?

2. En el Mundial de Fútbol del año 2006 los jugadores españoles seleccionados tenían

las siguientes edades.

Reina, 23 años Capdevila, 28 años

Albelda, 28 años Íker Casillas, 25 años

Michel Salgado, 30 años Senna, 29 años

Cañizares, 36 años

Sergio Ramos, 20 años Joaquín, 24 años

Antonio López, 24 años Marchena, 26 años

Reyes, 22 años

Pablo Ibáñez, 24 años Cesc, 19 años

Fernando Torres, 22 años Pernía, 29 años

Iniesta, 22 años Luis García, 27 años

Puyol, 28 años

Xavi, 26 años Raúl, 28 años

Juanito, 29 años Xabi Alonso, 24 años

Villa, 24 años

Completa la tabla y calcula

a. La media de edades en 2006.

b. La mediana en 2006. c. La moda en 2006.

Page 11: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 11 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

11

d. El rango en 2006.

e. La desviación estándar en 2006.

Comparación Entre Dos O Más Datos

Una de las principales aplicaciones de las medidas de tendencia central, de posición y de dispersión, es la comparación de dos o más conjuntos de datos. La media y la

mediana nos permiten ver cómo se comportan en promedio estos grupos, mientras que la varianza y la desviación estándar nos permiten comparar cómo se comportan estos

valores en torno a su media. No es necesario que los grupos a comparar tengan el

mismo número de observaciones

Recuerda que:

La mediana es aquel valor tal que bajo él se concentran al menos el 50% de las

observaciones. Para datos no agrupados, la mediana se determina ordenando las observaciones de menor a mayor. Si hay un número impar de datos, la mediana es

el valor que se encuentra exactamente en la mitad. Para un número par de datos, la mediana corresponde al promedio de los dos valores centrales.

Analicemos la siguiente situación:

Ximena plantea que el tabaquismo incide sobre los patrones de sueño de las personas. Por ello, observó el tiempo, en minutos, que demoran en quedarse dormidos 12

pacientes fumadores y 12 no fumadores, obteniendo la siguiente información Fumadores 69,3 53,2 60,2 56,0 48,1 43,8 22,1 52,7 23,2 47,6 34,4 13,8

No fumadores

28,6 29,8 30,6 36,0 25,1 28,4 31,8 37,9 26,4 38,5 41,6 13,9

¿Cómo puede Ximena verificar su hipótesis con los datos obtenidos? Si la media de ambos grupos fuera similar, aunque la desviación estándar sea

distinta, ¿cómo se interpreta en este contexto? En cambio, si tienen una desviación estándar similar, pero la media es distinta,

¿cómo se interpreta esto? ¿Qué otras medidas se podrían calcular con los datos obtenidos para justificar

mejor la hipótesis de Ximena?

Veamos

Observa los valores obtenidos para ambos grupos de la media, la varianza y la desviación estándar.

Para los fumadores, se tiene que:

�̅� = 43,7 minutos 𝑺𝟐 = 262,7 minutos2 Luego, la desviación estándar es 16,2 minutos.

Para los no fumadores, se tiene que:

�̅�x = 30,7 minutos 𝑺𝟐 = 50,3 minutos2 Y la desviación estándar es de 7,1 minutos.

También se puede calcular la mediana para ambos grupos para observar si hay

diferencias significativas entre los dos grupos.

La mediana para los fumadores es 47,9, es decir, el 50% de los fumadores se demora a lo más 47,9 minutos en dormirse. Por otra parte, para los no fumadores la mediana

es 30,2, es decir, el 50% de los no fumadores se demora a lo más 30,2 minutos en dormirse.

Basándose en todos estos resultados, se puede concluir que efectivamente se observa una alteración en el patrón de sueño de los fumadores, pues estos, en promedio, se

Page 12: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 12 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

12

demoran en dormirse 13 minutos más que los no fumadores. Además, el 50% de los

fumadores se demora 17,7 minutos más en dormirse que el 50% de los no fumadores

Por otra parte, en términos de variabilidad, la desviación estándar de los fumadores es mayor que la de los no fumadores. Se puede concluir, entonces, que el patrón de sueño

de los no fumadores es más estable que el de los fumadores.

La Homogeneidad Y La Heterogeneidad

La homogeneidad y la heterogeneidad son conceptos que se encuentran asociados a la variabilidad de un conjunto de datos. Mientras menor sea la varianza y, en su defecto,

la desviación estándar y el rango, más homogéneo es el grupo de observaciones que

estamos estudiando. Al contrario, si la varianza es mayor, entonces más heterogéneo es el grupo.

Por ejemplo:

Silvia es entrenadora de natación y es responsable de dos equipos de seis nadadores.

Los ha entrenado con metodologías distintas y quiere saber cuál de ellas es más efectiva. A continuación, se muestran los tiempos obtenidos, en segundos, por cada

uno de los participantes en la prueba de 100 metros libres que organizó Silvia para evaluar sus avances

Analicemos:

Para comparar estos resultados, ¿qué medidas puedes calcular? ¿Qué información es

importante revisar?

¿Cuál equipo tiene nadadores más rápidos?, ¿y cuál tiene al nadador más rápido?, ¿es el mismo?, ¿por qué?

¿Cuál equipo tiene los tiempos de sus nadadores más parejos?, ¿cómo lo calculaste? ¿Qué puedes concluir con respecto al rendimiento de los equipos?

Tanto para el equipo A como para el equipo B la media de las observaciones es de 90

segundos. La mediana del primer equipo es 85, mientras que la del segundo es 90. Entonces, para el equipo A el 50% de los nadadores se demora al menos 85 segundos,

y para el equipo B, al menos 90 segundos. El rango del equipo A es 90 segundos mientras que el rango del equipo B es 30 segundos. Por último, la desviación estándar

del equipo A es 28,9 segundos y la desviación estándar del equipo B es 9,1 segundos. Ambas medidas son menores para el equipo B. Esto nos indica que su desempeño fue

más parejo, es decir, no hay tanta diferencia en los resultados de sus integrantes como en el equipo A.

Al comparar dos o más conjuntos de datos, mientras menor es la desviación estándar o

la varianza de un conjunto, se dice que su comportamiento es más homogéneo (o regular) que los otros. Del mismo modo, mientras mayor es su desviación estándar o la

varianza, se dice que es más heterogéneo (o irregular). Por ejemplo, el equipo A tiene una desviación estándar de 28,9 segundos, esto se debe principalmente a que en ese

equipo está el nadador más lento (con 150 segundos), pero también está el más rápido (con 60 segundos). En cambio, los tiempos del equipo B son más parejos. Como, en

promedio, tienen igual rendimiento, se puede concluir que la metodología aplicada en el equipo B es más efectiva.

Actividad 4

Page 13: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 13 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

13

A. Se realizó un experimento para comparar el efecto de tres regímenes alimenticios sobre el aumento de peso. Se formaron tres grupos, uno con 10 individuos, otro con

12 y el tercero con 16. El primer grupo fue sometido a la dieta A, el segundo a la dieta B y el tercero a la dieta C. Después de 15 días se observaron los aumentos de

peso, en kilogramos, observando los siguientes resultados:

Dieta A: 1,0 0,0 2,1 3,1 3,3 4,3 5,2 5,5 5,0 6,8

Dieta B: 3,0 4,0 5,7 6,0 6,9 7,0 7,2 7,3 2,8 3,5 5,0 6,0

Dieta C: 3,1 0,0 2,1 3,1 3,1 4,3 5,2 5,5 5,0 6,8 1,5 1,1 2,6 3,2 3,8

4,8

Compara las tres dietas. ¿Cuál de las tres te parece más efectiva?, ¿por qué?

Medidas de posición:

Page 14: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 14 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

14

Las medidas de posición dividen el conjunto de datos en partes porcentuales

iguales, las medidas de posición más importantes son: los cuartiles los deciles y los percentiles.

Cuartiles: Son valores de la variable que dividen que dividen el conjunto ordenado de datos

en cuatro partes iguales. Cada una de estas partes representa el 25% del total de los datos. Los cuartiles son tres y se simbolizan 𝑄1, 𝑄2 𝑦 𝑄3

𝑸𝟏 Indica que a lo sumo el 25% de los datos son menores que él y a lo sumo

el 75% de los datos son mayores que él.

𝑸𝟐 es equivalente a la mediana y divide os datos en dos partes porcentuales

iguales

𝑸𝟑 Indica que máximo el 75% de los datos son menores que él y máximo el

25% de los datos son mayores que él.

Para calcular el valor de los cuartiles en datos no agrupados se ordenan los datos

y se encuentra la mediana que corresponde al 𝑸𝟐 (segundo cuartil), con los datos

menores o iguales que 𝑸𝟐 se calcula una nueva mediana que corresponde al

𝑸𝟏(primer cuartil) y con los datos mayores o iguales que 𝑸𝟐 se calcula una nueva

mediana que corresponde al 𝑸𝟑(tercer cuartil).

También se puede utilizar la siguiente formula:

Qk = k (N/4) donde

𝑸𝒌= Cuartil número 1, 2, 3 ó 4

N = total de datos de la distribución. Ejemplo :

En 20 pruebas de evaporación, de la sustancia MW008, se registran las siguientes variaciones de temperaturas a presión atmosférica: 41°, 50°, 29°, 33°, 40°, 42°, 53°,

35°, 28°, 39°, 37°, 43°, 34°, 31°, 44°, 57°, 32°, 45°, 46°, 48°. Calculando el valor del cuartil 1:

Paso 1: Ordenar los datos de menor a mayor.

28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°, 53°, 57°.

Paso 2: Ubicar la posición del valor que le corresponde al Q1: Q1 = k (N/4) = 1 (20/4) = 1(5) = 5

Al revisar la serie de datos la posición 5 le corresponde a 33°

Paso 3: El valor para el Q1 es 33°

Calculando el valor del cuartil 2:

Paso 1: Ordenar los datos de menor a mayor.

28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°, 53°, 57°.

Paso 2: Ubicar la posición del valor que le corresponde al Q2: Q2 = k (N/4) = 2 (20/4) = 2 (5) = 10

Al revisar la serie de datos la posición 10 le corresponde a 33° Paso 3: El valor para el Q2 es 40°

Nos dice: que la temperatura que deja bajo si el 50 % de la serie de datos es 40°. Calculando el valor del cuartil 3:

Paso 1: Ordenar los datos de menor a mayor. 28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°,

50°, 53°, 57°.

Paso 2: Ubicar la posición del valor que le corresponde al Q3: Q3 = k(N/4) = 3 (20/4) = 3 (5) = 15

Al revisar la serie de datos la posición 15 le corresponde a 45° Paso 3: El valor para el Q3 es 45°

Nos dice: que los valores entre 28° y 45 representan el 75 % de la serie de datos.

Calculando el valor del cuartil 4: Paso 1: Ordenar los datos de menor a mayor.

Page 15: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 15 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

15

28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°,

50°, 53°, 57°. Paso 2: Ubicar la posición del valor que le corresponde al Q4:

Q4 = k (N/4) = 4(20/4) = 4(5) = 20 Al revisar la serie de datos la posición 20 le corresponde a 57°

Paso 3: El valor para el Q4 es 57° Nos dice: la temperatura que deja bajo si el 100 % de la serie de datos es 57°.

Es de hacer notar que el Q4 coincide con el último valor de la serie de datos, por ello, su cálculo no se efectúa, se da por entendido que siempre el valor del cuartil 4 será el último valor de la serie de datos.

Cuartiles, deciles y percentiles Para datos agrupados

a) Ubicar donde se encuentra la clase: (k . N)

4, k = 1,2,3 en la tabla de frecuencias

acumuladas.

b) Determinar los cuartiles utilizando la fórmula:

𝐿𝑖 +

𝑘 . 𝑁 4 – 𝐹𝑖−1

𝑓𝑖 . 𝑎𝑖 𝑘 = 1,2,3.

Donde, 𝑳𝒊: es el límite inferior del rango donde se encuentra la clase.

𝑭𝒊−𝟏: Frecuencia acumulada de la clase que precede a la clase del p-ésimo percentil

𝒇𝒊: es la frecuencia relativa de la clase del p-ésimo percentil.

𝒂𝒊 : Amplitud de la clase del p-ésimo percentil.

𝑵 : número total de observaciones

Nota: para el cálculo de deciles y percentiles se reemplaza el 4 del denominador por 10 con k= 1... 9 y 100 respectivamente k = 1... 99.

Ejemplo:

Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por parte de una clínica, de reportes clínicos para realizar estudios de glucosa.

Para la obtención del primer cuartil tenemos k=1, obteniendo: 𝑘𝑛

4=

(1)(63)

4= 15.75

lo que representa que el primer cuartil se encuentre en la tercera clase, sus datos

están dados como: 𝐿𝑖= 20 ; 𝐹𝑖−1= 11; 𝑓𝑖=8; 𝑎𝑖 =9; 𝑁=63

Page 16: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 16 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

16

𝑄1 = 20 +

1 × (63)4 − 11

8× 9 = 25.34

Lo que indica que 25 % de los pacientes fueron mandados a valoración de glucosa en 25.34 días y el 75% de los pacientes atendidos lo hicieron después de

25.34 días.

Para la obtención del segundo cuartil consideraremos k=2, obteniendo: 𝑘𝑛

4=

(2)(63)

4= 31.5

Considerando que para este segundo cuartil

𝐿𝑖= 50 ; 𝐹𝑖−1= 31; 𝑓𝑖=5; 𝑎𝑖 =9; 𝑁=63

𝑄2 = 50 +

2 × (63)4 − 31

5× 9 = 50.9

Lo que indica que en 50.9 días se habían atendido al 50 % de los pacientes para ser valorados de los niveles de glucosa.

Para el cálculo del tercer cuartil, k=3, observamos que:

𝑘𝑛

4=

(3)(63)

4= 47.25

Con 𝐿𝑖= 70 ; 𝐹𝑖−1= 43; 𝑓𝑖=8; 𝑎𝑖 =9; 𝑁=63 , tenemos:

Tenemos:

𝑄3 = 70 +

3 × (63)4 − 43

8× 9 = 74.78

Lo cual indica que 75% de pacientes que envió la clínica a realizarse estudios de

glucosa lo realizo en 74.78días y el resto en los otros días restantes.

Para el cálculo para el cuarto cuartil es de manera inmediata, en este se contempla la

totalidad de la muestra, por lo que no es necesario realizar ningún cálculo, aunque si lo

realizamos observamos que cubre el total de días.

Representación gráfica (diagrama de caja) El diagrama de caja y bigote es un resumen grafico en el que se describen las

características más destacadas de un conjunto de datos. Este se construye utilizando los cuartiles, el procedimiento es el siguiente:

1. Se ubican los cuartiles en la recta numérica, la cual debe mostrar claramente el

dato menor y el dato mayor 2. Se determinan los extremos de la caja. Así, la caja está limitada por los cuartiles

𝑄1 y 𝑄3 y dentro de ella se ubica la mediana, es decir el cuartil 𝑄2. La caja se

señala sobre la recta como un rectángulo.

Los bigotes son dos líneas que se trazan teniendo en cuenta que: a. El primer bigote va desde el dato menor hasta el extremo inferior de la caja.

b. El segundo bigote va desde el extremo superior de la caja hasta el dato

mayor de la caja

Nota: La longitud de los bigotes no debe exceder una vez y media la de la caja, si hay valores extremos que superan esa medida se dibujan como puntos aislados.

Page 17: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 17 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

17

Actividad 5

1. Analiza el siguiente diagrama de caja y bigotes y calcula, a partir de él, los valores

máximo y mínimo, la mediana y los cuartiles.

2. Analiza el siguiente diagrama de caja y bigotes. Muestra los minutos que tarda en hacer efecto un medicamento en una población. Interpreta la información que

presenta y responde a las preguntas.

a. ¿A qué porcentaje de la población había hecho efecto al cabo de 30 minutos?

b. Al cabo de cuántos minutos había hecho efecto al 50 % de la población?

c. Cuántos minutos tardó en hacer efecto al 100% de la población?

d. A qué porcentaje había hecho efecto a los 55 minutos?

e. ¿Cuánto tardó en hacer efecto a las tres cuartas partes de la población?

3. La tabla muestra el consumo diario de agua, en ml, de los 20 alumnos de una clase.

Page 18: INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN 1 18 ... · conjunto de datos relevantes para su estudio. Si los datos se refieren a una muestra o población, será necesario agruparlos,

INSTITUCIÓN EDUCATIVA TÉCNICA SAGRADO CORAZÓN Aprobada según Resolución No. 8758000490 – NIT 800251680 – DANE 108758000490

SOLEDAD – ATLÁNTICO.

Página 18 de 18

Versión 1.0

PA_00_SGC_13012016 00 GUIAS Última revisión: 13/01/2017

18

Nombre Consumo diario de agua

a. Calcular los cuartiles, el

limite inferior y superior de los datos

b. Representa la información a través de un diagrama

de caja y bigotes c. Realiza tus propias

conclusiones según el diagrama

Juan 1650

Luis 1300

Alma 2400

Toño 2000

Rosa 2100

Lupe 1700

Paco 1900

Tere 1500

Iris 1900

Pepe 1850

Marco 2000

Luisa 2200

Julio 2300

Maya 1600

Alex 1900

Beto 2500

Rita 2200

Martha 1600

Omar 2100

David 1750

Evaluación final de la guía: 1. Da respuesta a la situación problema de la guía

2. Redacta un ensayo en el que resaltes la importancia que tiene las medidas de posición y dispersión

3. Del estudio de casos que realizaste en la actividad No 1, aplica las medidas de dispersión y verifica que tan acertados son los datos con respecto a la media.