Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que...
Transcript of Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que...
Materia: Estadística I
Maestro: Dr. Francisco Javier Tapia Moreno
Semestre: 2016-1
Universidad de SonoraDepartamento de Matemáticas
Área Económico Administrativa
Hermosillo, Sonora, a 16 de febrero de 2016.
Al describir grupos de observaciones, con frecuencia es
conveniente resumir la información con un solo número. Este
número que, para tal fin, suele situarse hacia el centro de la
distribución de datos se denomina medida o parámetro de
tendencia central o de centralización.
Las medidas de tendencia central más usuales son la media,
la mediana, la moda, los cuartiles, los quintiles, los deciles
y los percentiles las cuales son explicadas a continuación
usando un ejemplo práctico ya expuesto en la clase
anterior.
Introducción.
La idea de media o promedio (también llamada media
aritmética) formaliza el concepto intuitivo de punto de
equilibrio de las observaciones. Es decir, es el “centro de
gravedad” del recorrido de la variable, según la cantidad de
valores obtenidos.
Media aritmética o promedio.
Tabla 1: unidades de productos vendidos
Bebidas Helados Postres Total por
día
Lunes 11 4 3 18
Martes 8 2 5 15
Miércoles 23 13 4 40
Jueves 21 11 3 35
Viernes 5 1 2 8
Sábado 20 7 7 34
Domingo 18 12 16 46
Total
semana
106 50 40 196
La media aritmética de un conjunto de datos es el
cociente entre la suma de todos los datos y el número
de estos.
Ejemplo: La media aritmética de la venta semanal de
bebidas de acuerdo a la tabla anterior es:
11, 8, 23, 21, 5, 20, 18
La venta media semanal de las bebidas es:
15.1428577
106
7
182052123811
X
que suman 106
Hay 7 datos
Media aritmética (I)
Cálculo de la media aritmética cuando los datos
están agrupados.
Ejemplo. Las ventas registradas durante 8 semanas están
resumidas en la tabla siguiente:
18.571428656
040,1 X
Datos por frecuencias
𝟓 ∗ 𝟗 + 𝟏𝟓 ∗ 𝟐𝟒 + 𝟐𝟓 ∗ 𝟏𝟕 + 𝟑𝟓 ∗ 𝟔 =
Total de datos
1º. Se multiplican los datos por sus frecuencias absolutas respectivas,
y se suman.
2º. El resultado se divide entre el total de datos.
marca
de clase
Frecuencia
absoluta
5 9
15 24
25 17
35 6
Total 56
Interpretación: Si se elige al azar un día, se espera
que ese día, la cantidad vendida de bebidas,
helados y postres en el abarrotes, sea de 18.57≈ 19
productos.
La media aritmética tiene varias propiedades importantes:
1) Si se suma la distancia de todos los valores respecto de lamedia, esa suma da cero.
2) Si se toman una cantidad cualesquiera de conjuntos devalores, cada uno con su respectiva media, la media delconjunto general es igual a la suma de cada una de las mediasde los diferentes conjuntos.
3) Es posible hallar la media de un conjunto de valores de unavariable tomando la distancia de las observaciones a un valorcualquiera (pertenezca o no al recorrido de la variable)
4) si a un conjunto de observaciones de una variable se lerealiza una operación matemática usando un valor constante,entonces la media del nuevo grupo de valores así obtenidos esigual a la aplicación de la misma operación matemáticausando ese valor constante sobre la media original.
Propiedades de la Media
Mediana para datos no agrupados
La mediana, a diferencia de la media no busca el valor central
del recorrido de la variable según la cantidad de
observaciones, sino que busca determinar el valor que tiene
aquella observación que divide la cantidad de observaciones
en dos mitades iguales. Por lo tanto es necesario atender a la
ordenación de los datos, y debido a ello, este cálculo
depende de la posición relativa de los valores obtenidos. Es
necesario, antes que nada, ordenar los datos de menor a
mayor (o viceversa). La ubicación de la mediana viene dada
por las relaciones
en caso que N sea imparen caso que N sea par
La mediana de un conjunto de datos es un valor del mismo tal
que el número de datos menores que él es igual al número de
datos mayores que él.
Por ejemplo, de acuerdo con la tabla dada antes, en número
de bebidas vendidas en los 7 días de fútbol son: 11, 8, 23,
21, 5, 20, 18
1º. Ordenamos los datos: 5, 8, 11, 18, 20, 21, 23
2º. El dato que queda en el centro es 18. La mediana vale 65.
Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana
es:64
2
6563
Caso 2:
La mediana para datos no agrupados.
donde:
: mediana
: limite real (o frontera) inferior de la clase
mediana.
: número total de datos.
: suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
: frecuencia de la clase mediana
: amplitud de clase
c
Mdf
Fn
Md i
1
2
1
L
Md
iL
n
F
Mdf
c
La mediana para datos agrupados
Ejemplo: Las cantidades de bebidas vendidas durante 8semanas aparecen ordenadas de la tabla siguiente. Calculee interprete la mediana.
Primero ubicamos la clase que
contiene a la mediana.
1024
)9(2
)156(
10
dM
1024
95.2810
Mediana = 18.125 bebidas
dato. 295.282
156
2
1 o
N
Intervalo de clase
Frecuencia
absoluta
De 0 a menos de 10 9
De 10 a menos de 20 24
De 20 a menos de 30 17
De 30 a menos de 40 6
Total 56
Clase mediana
Interpretación: La mitad de las cantidades
vendidas de bebidas es menor que 18.125. La
otra mitad de las cantidades vendidas es igual
o mayor a 18.125 bebidas.
Ventajas:
Los valores extremos no afectan a la mediana comoen el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos, registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero laserie de datos.
Para una serie amplia de datos no agrupados, elproceso de ordenamiento de los datos demandatiempo y usualmente provoca equivocaciones.
Ventajas y desventajas de la mediana
Por ejemplo, las cantidades de postres vendidos durante
la primer semana son:
El número que más se repite es el 3. por lo
tanto la moda de los postres es 3.
Moda
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
3 5 4 3 2 7 16
La moda, es aquel dato o valor de la variable que más se
repite; es decir, aquel valor de la variable (que puede no
ser un único valor) con una frecuencia mayor
Cálculo de la moda para datos agrupados
donde:
: moda
: limite real (o frontera) inferior de la clase
modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
frecuencia de la clase siguiente
: amplitud de clase
cdd
d
i
21
1LoM
oM
iL
2d
c
1d
Ejemplo: Las cantidades de bebidas vendidas durante 8semanas aparecen ordenadas de la tabla siguiente. Calculee interprete la moda.
Primero ubicamos la clase que
contiene a la moda. Es la
clase que tiene mayor
frecuencia absoluta
101724()924(
)924(10
oM
10715
1510
Moda = 16.8181... bebidas
Intervalo de clase
Frecuencia
absoluta
De 0 a menos de 10 9
De 10 a menos de 20 24
De 20 a menos de 30 17
De 30 a menos de 40 6
Total 56
Clase modal
Interpretación. El número más frecuente de productos
vendidos al día es de 19.
Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativoscomo cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una omás clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribuciónamodal).
En otros casos la distribución tiene variasmodas, lo que dificulta su interpretación.
Cuartiles,
La mediana, como vimos, separa en dos mitades el conjuntoordenado de observaciones. Podemos a su vez subdividir cadamitad en dos, de tal manera que resulten cuatro partesiguales. Cada una de esas divisiones se conoce como Cuartil ylo simbolizaremos mediante la letra Q agregando un subíndicesegún a cual de los cuatro cuartiles nos estemos refiriendo.
Se llama primer cuartil (𝑄1) a la mediana de la mitad quecontiene los datos más pequeños. Este cuartil, corresponde almenor valor que supera – o que deja por debajo de él – a lacuarta parte de los datos.
Se llama tercer cuartil (𝑄3) a la mediana de la mitad formadapor las observaciones más grandes. El tercer cuartil es elmenor valor que supera – o que deja por debajo de él – a lastres cuartas partes de las observaciones. Con estaterminología, la mediana es el segundo cuartil (𝑄2 ) y elcuarto cuartil (𝑄4) coincide con el valor que toma el últimodato, luego de ordenados.
Quintiles, Deciles y Percentiles
Los quintiles dividen en 5 partes el conjunto ordenado deobservaciones. Cada uno respectivamente conteniendo el20%, 40%, 60%, 80% y 100% de la totalidad de los datos.
Los deciles dividen en 10 partes el conjunto ordenado deobservaciones. Cada uno respectivamente conteniendo el10%, 20%, 30%, … 90% y 100% de la totalidad de los datos.
Los percentiles dividen en 100 partes el conjunto ordenado deobservaciones. Cada uno respectivamente conteniendo el 1%,2%, 3%, … 99% y 100% de la totalidad de los datos.
La forma de calcular todos estos valores aparece en lasnotas de clase del tema II, páginas 19-22.
Conclusión
Las medidas de tendencia central son medidas estadísticas quepretenden resumir en un solo valor a un conjunto de valores.Representan un centro en torno al cual se encuentra ubicadoel conjunto de los datos.
Las medidas de tendencia central más utilizadasson: media, mediana, moda, cuartiles, deciles ypercentiles.
Los procedimientos para calcular estas medidas estadísticasdifieren levemente dependiendo de la forma en que seencuentren los datos.