Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que...

21
Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 2016-1 Universidad de Sonora Departamento de Matemáticas Área Económico A dministrativa Hermosillo, Sonora, a 16 de febrero de 2016.

Transcript of Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que...

Page 1: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Materia: Estadística I

Maestro: Dr. Francisco Javier Tapia Moreno

Semestre: 2016-1

Universidad de SonoraDepartamento de Matemáticas

Área Económico Administrativa

Hermosillo, Sonora, a 16 de febrero de 2016.

Page 2: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Al describir grupos de observaciones, con frecuencia es

conveniente resumir la información con un solo número. Este

número que, para tal fin, suele situarse hacia el centro de la

distribución de datos se denomina medida o parámetro de

tendencia central o de centralización.

Las medidas de tendencia central más usuales son la media,

la mediana, la moda, los cuartiles, los quintiles, los deciles

y los percentiles las cuales son explicadas a continuación

usando un ejemplo práctico ya expuesto en la clase

anterior.

Introducción.

Page 3: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

La idea de media o promedio (también llamada media

aritmética) formaliza el concepto intuitivo de punto de

equilibrio de las observaciones. Es decir, es el “centro de

gravedad” del recorrido de la variable, según la cantidad de

valores obtenidos.

Media aritmética o promedio.

Page 4: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Tabla 1: unidades de productos vendidos

Bebidas Helados Postres Total por

día

Lunes 11 4 3 18

Martes 8 2 5 15

Miércoles 23 13 4 40

Jueves 21 11 3 35

Viernes 5 1 2 8

Sábado 20 7 7 34

Domingo 18 12 16 46

Total

semana

106 50 40 196

Page 5: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

La media aritmética de un conjunto de datos es el

cociente entre la suma de todos los datos y el número

de estos.

Ejemplo: La media aritmética de la venta semanal de

bebidas de acuerdo a la tabla anterior es:

11, 8, 23, 21, 5, 20, 18

La venta media semanal de las bebidas es:

15.1428577

106

7

182052123811

X

que suman 106

Hay 7 datos

Media aritmética (I)

Page 6: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Cálculo de la media aritmética cuando los datos

están agrupados.

Ejemplo. Las ventas registradas durante 8 semanas están

resumidas en la tabla siguiente:

18.571428656

040,1 X

Datos por frecuencias

𝟓 ∗ 𝟗 + 𝟏𝟓 ∗ 𝟐𝟒 + 𝟐𝟓 ∗ 𝟏𝟕 + 𝟑𝟓 ∗ 𝟔 =

Total de datos

1º. Se multiplican los datos por sus frecuencias absolutas respectivas,

y se suman.

2º. El resultado se divide entre el total de datos.

marca

de clase

Frecuencia

absoluta

5 9

15 24

25 17

35 6

Total 56

Page 7: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Interpretación: Si se elige al azar un día, se espera

que ese día, la cantidad vendida de bebidas,

helados y postres en el abarrotes, sea de 18.57≈ 19

productos.

Page 8: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

La media aritmética tiene varias propiedades importantes:

1) Si se suma la distancia de todos los valores respecto de lamedia, esa suma da cero.

2) Si se toman una cantidad cualesquiera de conjuntos devalores, cada uno con su respectiva media, la media delconjunto general es igual a la suma de cada una de las mediasde los diferentes conjuntos.

3) Es posible hallar la media de un conjunto de valores de unavariable tomando la distancia de las observaciones a un valorcualquiera (pertenezca o no al recorrido de la variable)

4) si a un conjunto de observaciones de una variable se lerealiza una operación matemática usando un valor constante,entonces la media del nuevo grupo de valores así obtenidos esigual a la aplicación de la misma operación matemáticausando ese valor constante sobre la media original.

Propiedades de la Media

Page 9: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Mediana para datos no agrupados

La mediana, a diferencia de la media no busca el valor central

del recorrido de la variable según la cantidad de

observaciones, sino que busca determinar el valor que tiene

aquella observación que divide la cantidad de observaciones

en dos mitades iguales. Por lo tanto es necesario atender a la

ordenación de los datos, y debido a ello, este cálculo

depende de la posición relativa de los valores obtenidos. Es

necesario, antes que nada, ordenar los datos de menor a

mayor (o viceversa). La ubicación de la mediana viene dada

por las relaciones

en caso que N sea imparen caso que N sea par

Page 10: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

La mediana de un conjunto de datos es un valor del mismo tal

que el número de datos menores que él es igual al número de

datos mayores que él.

Por ejemplo, de acuerdo con la tabla dada antes, en número

de bebidas vendidas en los 7 días de fútbol son: 11, 8, 23,

21, 5, 20, 18

1º. Ordenamos los datos: 5, 8, 11, 18, 20, 21, 23

2º. El dato que queda en el centro es 18. La mediana vale 65.

Si el número de datos fuese par, la mediana es la

media aritmética de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana

es:64

2

6563

Caso 2:

La mediana para datos no agrupados.

Page 11: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

donde:

: mediana

: limite real (o frontera) inferior de la clase

mediana.

: número total de datos.

: suma de todas las frecuencias hasta, pero

sin incluir, la clase mediana.

: frecuencia de la clase mediana

: amplitud de clase

c

Mdf

Fn

Md i

1

2

1

L

Md

iL

n

F

Mdf

c

La mediana para datos agrupados

Page 12: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Ejemplo: Las cantidades de bebidas vendidas durante 8semanas aparecen ordenadas de la tabla siguiente. Calculee interprete la mediana.

Primero ubicamos la clase que

contiene a la mediana.

1024

)9(2

)156(

10

dM

1024

95.2810

Mediana = 18.125 bebidas

dato. 295.282

156

2

1 o

N

Intervalo de clase

Frecuencia

absoluta

De 0 a menos de 10 9

De 10 a menos de 20 24

De 20 a menos de 30 17

De 30 a menos de 40 6

Total 56

Clase mediana

Page 13: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Interpretación: La mitad de las cantidades

vendidas de bebidas es menor que 18.125. La

otra mitad de las cantidades vendidas es igual

o mayor a 18.125 bebidas.

Page 14: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Ventajas:

Los valores extremos no afectan a la mediana comoen el caso de la media aritmética.

Es fácil de calcular, interpretar y entender.

Se puede determinar para datos cualitativos, registrados bajo una escala ordinal.

Desventajas:

Como valor central, se debe ordenar primero laserie de datos.

Para una serie amplia de datos no agrupados, elproceso de ordenamiento de los datos demandatiempo y usualmente provoca equivocaciones.

Ventajas y desventajas de la mediana

Page 15: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Por ejemplo, las cantidades de postres vendidos durante

la primer semana son:

El número que más se repite es el 3. por lo

tanto la moda de los postres es 3.

Moda

Lunes Martes Miércoles Jueves Viernes Sábado Domingo

3 5 4 3 2 7 16

La moda, es aquel dato o valor de la variable que más se

repite; es decir, aquel valor de la variable (que puede no

ser un único valor) con una frecuencia mayor

Page 16: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Cálculo de la moda para datos agrupados

donde:

: moda

: limite real (o frontera) inferior de la clase

modal (la de mayor frecuencia)

: frecuencia de la clase modal menos la

frecuencia de la clase anterior

: frecuencia de la clase modal menos la

frecuencia de la clase siguiente

: amplitud de clase

cdd

d

i

21

1LoM

oM

iL

2d

c

1d

Page 17: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Ejemplo: Las cantidades de bebidas vendidas durante 8semanas aparecen ordenadas de la tabla siguiente. Calculee interprete la moda.

Primero ubicamos la clase que

contiene a la moda. Es la

clase que tiene mayor

frecuencia absoluta

101724()924(

)924(10

oM

10715

1510

Moda = 16.8181... bebidas

Intervalo de clase

Frecuencia

absoluta

De 0 a menos de 10 9

De 10 a menos de 20 24

De 20 a menos de 30 17

De 30 a menos de 40 6

Total 56

Clase modal

Interpretación. El número más frecuente de productos

vendidos al día es de 19.

Page 18: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Ventajas y desventajas de la moda.

Ventajas:

Se puede utilizar tanto para datos cualitativoscomo cuantitativos.

No se ve afectada por los valores extremos.

Se puede calcular, a pesar de que existan una omás clases abiertas.

Desventajas:

No tiene un uso tan frecuente como la media.

Muchas veces no existe moda (distribuciónamodal).

En otros casos la distribución tiene variasmodas, lo que dificulta su interpretación.

Page 19: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Cuartiles,

La mediana, como vimos, separa en dos mitades el conjuntoordenado de observaciones. Podemos a su vez subdividir cadamitad en dos, de tal manera que resulten cuatro partesiguales. Cada una de esas divisiones se conoce como Cuartil ylo simbolizaremos mediante la letra Q agregando un subíndicesegún a cual de los cuatro cuartiles nos estemos refiriendo.

Se llama primer cuartil (𝑄1) a la mediana de la mitad quecontiene los datos más pequeños. Este cuartil, corresponde almenor valor que supera – o que deja por debajo de él – a lacuarta parte de los datos.

Se llama tercer cuartil (𝑄3) a la mediana de la mitad formadapor las observaciones más grandes. El tercer cuartil es elmenor valor que supera – o que deja por debajo de él – a lastres cuartas partes de las observaciones. Con estaterminología, la mediana es el segundo cuartil (𝑄2 ) y elcuarto cuartil (𝑄4) coincide con el valor que toma el últimodato, luego de ordenados.

Page 20: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Quintiles, Deciles y Percentiles

Los quintiles dividen en 5 partes el conjunto ordenado deobservaciones. Cada uno respectivamente conteniendo el20%, 40%, 60%, 80% y 100% de la totalidad de los datos.

Los deciles dividen en 10 partes el conjunto ordenado deobservaciones. Cada uno respectivamente conteniendo el10%, 20%, 30%, … 90% y 100% de la totalidad de los datos.

Los percentiles dividen en 100 partes el conjunto ordenado deobservaciones. Cada uno respectivamente conteniendo el 1%,2%, 3%, … 99% y 100% de la totalidad de los datos.

La forma de calcular todos estos valores aparece en lasnotas de clase del tema II, páginas 19-22.

Page 21: Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del... · 2º. El dato que queda en el centro es 18. La mediana vale 65. Si el número de datos fuese par, la mediana

Conclusión

Las medidas de tendencia central son medidas estadísticas quepretenden resumir en un solo valor a un conjunto de valores.Representan un centro en torno al cual se encuentra ubicadoel conjunto de los datos.

Las medidas de tendencia central más utilizadasson: media, mediana, moda, cuartiles, deciles ypercentiles.

Los procedimientos para calcular estas medidas estadísticasdifieren levemente dependiendo de la forma en que seencuentren los datos.