Apuntes. Medidas de Tendencia Central

8

Click here to load reader

Transcript of Apuntes. Medidas de Tendencia Central

Page 1: Apuntes. Medidas de Tendencia Central

1

Clase 3

Descripción de datos y propiedades de datos cuantitativos.

Conceptos básicos: Tendencia central y dispersión.

Los datos al igual que los estudiantes, se congregan alrededor de sus puntos de encuentro

favoritos. Parece que los estudiantes acuden en masa a sitios como partidos de futbol, discos,

los estacionamientos del boulevard, entre otros lugares. De igual forma, los números parecen

disfrutar de la compañía de otros números y están propensos a reunirse alrededor de un

punto central denominado medida de la tendencia central o, más comúnmente, media. Una

medida de tendencia centrar ubica e identifica el punto alrededor del cual se centran los

datos.

Un conjunto de datos puede ser descrito con un solo número. Si el profesor dice que el

promedio de la clase en el último examen fue de 95, esto indica algo. Si dice que el promedio

fue de 35, esto indica algo totalmente diferente.

Además las medidas de dispersión indican el punto hasta el cual las observaciones

individuales se esparcen alrededor de su punto central. Miden la dispersión o la variabilidad

de los datos y reflejan la tendencia de las observaciones individuales a desviarse de dicho

punto central.

Medidas de tendencia central para datos sin agrupar. Media aritmética. Poblacional y muestral.

Mediana.

Moda.

Media ponderada.

Media geométrica.

La media

Es la medida de tendencia central que usualmente se llama promedio.

Media poblacional

La media de una población es el parámetro µ (se pronuncia miu). Si hay N observaciones en el

conjunto de datos de la población, la media se calcula así:

Media muestral

La media de una muestra es un estadístico (se lee equis barra). Con n observaciones en el

conjunto de datos de la muestra, la media se determina así:

Page 2: Apuntes. Medidas de Tendencia Central

2

La mediana

La observación de la mitad después de que se han colocado los datos en una serie ordenada.

Se le conoce también como media posicional. La mitad de las observaciones queda debajo de

la mediana y la otra mitad queda encima de ésta.

Por ejemplo, tenemos ordenados de menor a mayor los ingresos mensuales registrados en los

últimos 5 meses (en miles de pesos):

45, 52, 56, 67, 67

La posición de la mediana se encuentra en el lugar 3 de la serie ordenada.

El valor que está en el tercer lugar es el 56, por lo tanto la mediana = 56

Cuando el número de datos es par, se promedian los valores medios.

35, 45, 52, 56, 67, 67

El tercer valor se promedia con el cuarto para obtener el valor que está en la posición 3.5

Entonces la mediana = 54

La moda

Es la observación que ocurre con mayor frecuencia. Un conjunto de datos puede tener una

sola moda, ser bimodal o multimodal o no tener ninguna moda (cuando todos los datos

ocurren con la misma frecuencia).

Ejemplo.

De una muestra de 15 trabajadores se obtuvieron la cantidad de horas extra el mes pasado.

13 12 15

6 15 13

13 10 5

7 7 12

12 9 12 Ordenando los datos…

Page 3: Apuntes. Medidas de Tendencia Central

3

5

6

7

7

9

10

12

12

12

12

13

13

13

15

15

Media 10.73

Mediana 12

Moda 12

Y si los datos se encontraran en una distribución de frecuencias…

valores Frecuencia xi * ni

5 1 5

6 1 6

7 2 14

8 0 0

9 1 9

10 1 10

11 0 0

12 4 48

13 3 39

14 0 0

15 2 30

15 161

Luego,

Page 4: Apuntes. Medidas de Tendencia Central

4

161 / 15 = 10.73333

Posición de la mediana = (15+1) /2= 8

Cuando los datos están en una distribución de frecuencias, se utiliza la frecuencia acumulada.

valores Frecuencia Frecuencia acumulada

5 1 1

6 1 2

7 2 4

8 0 4

9 1 5

10 1 6

11 0 6

12 4 10

13 3 13

14 0 13

15 2 15

15

La media ponderada

Se utiliza cuando quiere darse diferente peso o importancia relativa a las observaciones.

Ejemplo.

Una empresa de construcción paga a sus empleados que trabajan por hora $16.50, $19.00 o

$25.00 la hora. Hay 26 empleados contratados para trabajar por hora, 14 de los cuales reciben

la tarifa de $16.50; 10 la tarifa de $19.00 y 2 con la de $25.00 ¿Cuál es la tarifa promedio por

hora que se paga a los 26 empleados?

Ejemplo.

PRODUCTO UTILIDAD POR PZ VOLUMEN DE VENTAS UTILIDAD TOTAL

Aspirina $ 2.00 50 $ 100.00

Tylenol $ 3.50 35 $ 122.50

Paracetamol $ 6.00 5 $ 30.00

$ 11.50 90 $ 252.50

$ 2.81 MEDIA PONDERADA

Page 5: Apuntes. Medidas de Tendencia Central

5

La media geométrica

Proporciona una medida precisa de un cambio porcentual promedio de una serie de números.

Donde cada valor Xi es el cambio porcentual de un periodo al otro:

La media geométrica siempre es menor o igual (nunca mayor) que la media aritmética. Todos

los datos deben ser positivos.

AÑO INGRESO FACTOR DE CRECIMIENTO

1992 $ 50,000.00 -

1993 $ 55,000.00 1.10

1994 $ 66,000.00 1.20

1995 $ 60,000.00 0.91

1996 $ 78,000.00 1.30

MG = 1.1176-1 = 0.1176 = 11.76% cambio porcentual.

Comparación entre media, mediana y moda

La media es la medida más común de tendencia central. Se presta para mayor manipulación e

interpretación algebraica. Desafortunadamente, la media se ve afectada por valores extremos

o valores atípicos y, a diferencia de la mediana, puede ser sesgada por las observaciones que

están muy por encima o muy por debajo de ésta.

Ejemplo:

4, 5, 6, 6, 7, 8

Media= 6

Mediana = 6

Moda = 6

Si la última observación fuera 80 en lugar de 8…

Media= 18

Mediana= 6

Moda= 6

Page 6: Apuntes. Medidas de Tendencia Central

6

La media se vuelve menos descriptiva o representativa de los datos.

Una medida no es mejor que otras. Un vendedor de zapatos le interesa más saber la moda de

las tallas de zapatos que vende en lugar de la media. Pero a un fabricante de puertas le

interesa más saber la estatura promedio de las personas.

Medidas de tendencia central para datos agrupados Media

Mediana

Moda

Debe tenerse en mente que los cálculos hechos utilizando datos agrupados son sólo

aproximaciones. Por tanto, las observaciones sin agrupar deben utilizarse cuando sea posible

para obtener conclusiones.

Media

f es la frecuencia o número de observaciones en cada intervalo. MC es la marca de clase del intervalo. n es el tamaño de la muestra (la suma de todas las frecuencias).

Mediana

El intervalo o clase donde está la mediana tiene una frecuencia acumulada mayor o igual a ⁄ .

Ya localizado el intervalo, se aplica la fórmula:

[ ⁄

] ( )

LIRmd es el límite inferior real de la clase donde está la mediana.

F es la frecuencia acumulada de la clase que antecede a la mediana.

fmd es la frecuencia de la clase donde está la mediana.

c es la amplitud del intervalo.

Moda

Se buscará el intervalo modal (el que tiene más frecuencia). Ya localizado, se aplicará la

siguiente fórmula:

Page 7: Apuntes. Medidas de Tendencia Central

7

[

] ( )

LIRmo es el límite inferior real de la clase modal.

Da es la diferencia entre la frecuencia de la clase modal y la clase que la antecede.

Db es la diferencia entre la frecuencia de la clase modal y la clase que le sigue.

c es la amplitud del intervalo.

Ejemplo.

Las edades de 50 directores ejecutivos de las mejores corporaciones de EU, reportadas en la

revista Forbes en 1997 aparecen en la siguiente tabla de frecuencias.

Edades Frecuencia MC Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

fMC

[50, 55) 8 52.5 16% 8 16% 420

[55, 60) 13 57.5 26% 21 42% 747.5

[60, 65) 15 62.5 30% 36 72% 937.5

[65, 70) 10 67.5 20% 46 92% 675

[70, 75) 3 72.5 6% 49 98% 217.5

[75, 80) 1 77.5 2% 50 100% 77.5

50 100% 3075

Media.

Mediana.

[

] ( )

Moda.

[( )

( ) ( )] ( )

Page 8: Apuntes. Medidas de Tendencia Central

8

8

13

15

10

3

1

0

2

4

6

8

10

12

14

16

[50, 55) [55, 60) [60, 65) [65, 70) [70, 75) [75, 80)

Fre

cue

nci

a

Edades de directores ejecutivos