Estadística Básica
Curso de Estadística Básica
MCC. Manuel Uribe SaldañaMCC. José Gonzalo Lugo Pérez
SESION 4MEDIA Y DESVIACIÓN ESTÁNDAR DE
DISTRIBUCIONES DE FRECUENCIA,MEDIDAS DE POSICIÓN
Estadística Básica
Objetivo
Calcular la media y desviación estándar de diagramas de frecuencia. Conocer las medidas de posición y su interpretación.
Estadística Básica
Agenda Sesión 4
• Revisión del examen de la sesión 1 y 2
• Media y desviación estándar en diagramas de frecuencia
• Medidas de Posición– Cuartil– Percentil– Puntaje estándar
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
• Calcular la media, varianza y desviación estándar para el siguiente conjunto de datos:
3 1 3 1 3 2 43 2 4 2 4 4 32 3 2 3 2 2 21 4 1 4 1 3 2
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
• Para calcular la media y la varianza de la muestra, es necesaria la suma de los 28 valores x y la suma de los 28 valores de x al cuadrado, así:
• Del ejemplo anterior se obtiene una distribución de frecuencias:
x f1 52 93 84 6
Suma 28
x =
Estadística Básica
Σx = 1 + 1 +…+ 1 + 2 + 2 +…+ 2 + 3 + 3 +…+ 3 + 4 + 4 +…+ 4
Media y Desviación estándar de distribuciones de frecuencia
5 sumandos 9 sumandos 8 sumandos 6 sumandos
Σx = (5)(1) + (9)(2) + (8)(3) + (6)(4)
Σx = 5 + 18 + 24 + 24 = 71
Σx2 = 12 +…+ 12 + 22 +…+ 22 + 32 +…+ 32 + 42 +…+ 42
5 sumandos 9 sumandos 8 sumandos 6 sumandos
Σx2 = (5)(1) + (9)(4) + (8)(9) + (6)(16)
Σx2 = 5 + 36 + 72 + 96 = 209
Estadística Básica
Se utilizará la distribución de frecuencias para determinar las sumatorias, obteniendo una tabla de extensiones:
Media y Desviación estándar de distribuciones de frecuencia
x f xf x2f1 5 5 52 9 18 363 8 24 724 6 24 96
Suma 28 71 209
Número de datos
Suma de x, Σxf, usando las
frecuencias.
Suma de x2, Σx2f, usando las
frecuencias.
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
• Para encontrar la media de una distribución de frecuencias se tiene:
x barra =suma de x, usando frecuencias
número
x = ΣxfΣf En la fórmula para la media se utiliza n,
x = ΣxfΣf
= 771
282.536
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Media y Desviación estandar de distribuciones de frecuencia
• Para encontrar la varianza de la distribución de frecuencias se tiene:
s cuadrada =(suma de x2, usando frecuencias) – (suma de x, usando frecuencias)2
número - 1
número
073.1
27
964.28
1282871
209
1
22
2
2
f
f
xffx
s
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
• Para encontrar la Desviación estándar de la distribución de frecuencias se tiene:
036.1073.12 ss
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de distribuciones de frecuencia
Estadística Básica
Ejercicios
1. Encontrar la media, la varianza y la desviación estándar de la muestra de 50 puntajes de examen, usando la distribución de frecuencias agrupadas:
Numero de clases Marca de clase, x f1 40 22 50 23 60 74 70 135 80 116 90 117 100 4
Media: 75.6Varianza: 221.1Desviación Estándar: 14.9
Estadística Básica
Ejercicios
2. Una empresa productora de láminas metálicas utiliza varios reparadores de problemas para hacer composturas de emergencia en los hornos. Por lo común, este personal realiza varios viajes cortos. Para efectos de estimar los gastos por viajes del año próximo, la empresa tomó una muestra de 20 cupones de gastos de viaje relacionados con la reparación de dichos problemas. Se obtuvo la siguiente información:
Calcule la media y la desviación estándar de estas cantidades de gastos por viaje en dólares.
Media: 21.00Desviación Estándar: 9.95
Cantidad de dólares en cupones Número de cupones
$0.00 - 10.00 2$10.00 - 20.00 8$20.00 - 30.00 7$30.00 - 40.00 2$40.00 - 50.00 1Total de la muestra 20
Estadística Básica
Estadística descriptiva
Medidas de tendencia
central
Medidas de dispersión
Medidas de posición
Tipos de distribución
Estadística Básica
Cuartiles
Son los valores de la variable que dividen en cuartos a los datos ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil, Q1,es el número tal que cuando mucho el 25% de los datos es menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. El segundo cuartil es la media. El tercer cuartil, Q3 , es un número tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor que Q3
25% 25% 25% 25%
Mín MáxQ1 Q2 Q3
Datos clasificados en orden creciente
Estadística Básica
Percentiles
Son los valores de la variable que dividen a un conjunto de datos ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil, Pk, es un valor tal que cuando mucho k% de los datos son más pequeños en valor que Pk y cuando mucho (100-k)% de los datos es mayor.
1% 1% 1% 1%
Mín P5P1 P2 P3
1% 1% 1% 1%
MáxP97 P98 P99
Datos clasificados en orden creciente
A lo más k A lo más (100 – k)%
Mín MáxPk
Estadística Básica
Percentiles
Notas:
1. El primer cuartil y el 25avo percentil son iguales; es decir, Q1 = P25.
También, Q3 = P75.
2. La mediana, el segundo cuartil, y el 50avo percentil son iguales.
De esta forma, cuando se pida encontrar P50 o Q2, se puede aplicar el procedimiento para encontrar la mediana.
502~ PQx
Estadística Básica
Procedimiento para determinar el valor de cualquier k-ésimo percentil o cuartil
Ordenar los datos, del más chico al más grande
5.)( APd k Se obtiene un entero A
Pk está a la mitad entre el valor del dato en la A-ésima posición y el valor del siguiente dato.
100
nkCalcular
Se obtiene un número con una fracción
BPd k )(
Pk, es el valor del dato en la B-ésima posición
Paso 1
Paso 2
Paso 3
Paso 4
Estadística Básica
Ejemplo
• Con la muestra de 50 puntajes del examen final del curso de estadística elemental que se observa en la tabla, determinar el primer cuartil, Q1, el 58avo percentil, P58, y el tercer cuartil, Q3.
60 47 82 95 88 72 67 66 68 9890 77 86 58 64 95 74 72 88 7477 39 90 63 68 97 70 64 70 7058 78 89 44 55 85 82 83 72 7772 86 50 94 92 80 91 75 76 78
Estadística Básica
Ejemplo
• Paso 1– Ordenar los datos
39 64 72 78 8944 66 72 80 9047 67 74 82 9050 68 74 82 9155 68 75 83 9258 70 76 85 9458 70 77 86 9560 70 77 86 9563 72 77 88 9764 72 78 88 98
Datos ordenados: puntajes del examen de estadística
Estadística Básica
Ejemplo
Paso 2Encontrar
n = 50 y k = 25, ya que Q1 = P25
Paso 3Encontrar la profundidad de Q1; d(Q1)=13 (Debido a que 12.5 contiene una fracción, B está más próximo al siguiente entero más grande, 13)
Paso 4Encontrar Q1: Q1 es el 13avo valor contando a partir del Mínimo. Q1 = 67
5.12100
)25)(50(
100
nk
Estadística Básica
P58
Paso 2Encontrar
n = 50 y k = 58, debido a P58
Paso 3Encontrar la profundidad de P58; d(P58) = 29.5 (Como A = 29 (un entero), se suma .5 y se usa 29.5)
Paso 4Encontrar P58: P58 es el valor que está a la mitad entre los valores de las porciones de datos 29ava y 30ava, contando a partir del Mínimo.
P58 = (77 + 78)/2 = 77.5
29100
)58)(50(
100
nk
Estadística Básica
Q3
Estadística Básica
Puntaje estándar (puntaje z)
• Posición que tiene un valor particular de x con respecto a la media, medida en desviaciones estándar. El puntaje z se calcula con la fórmula:
s
xxz
Estadística Básica
Ejemplo
• Encontrar los puntajes estándar para a) 92 y b) 72 con respecto a una muestra de puntajes de un examen que tiene como media de 74.9 y una desviación estándar de 14.19
20.019.14
9.7472,.19.14;9.74,72
20.119.14
9.7492,.19.14;9.74,92
s
xxzAsísxx
s
xxzAsísxx
Lo anterior significa que el puntaje 92 está a 1.2 desviaciones estándar por arriba de la media, mientras que el puntaje 72 está a 0.2 desviaciones estándar por debajo de la media.
Estadística Básica
Notas
1. Normalmente, el valor calculado de z se redondea al centésimo más próximo
2. El intervalo de variación aproximado del valor de los puntajes z suele ir de -3.00 a +3.00
Estadística Básica
Ejercicios
1. Una muestra tiene una media de 50 y una desviación estándar de 4. Encuentre el puntaje z para cada valor de x.
• X=54
• X=50
• X=59
• X=45
Estadística Básica
Ejercicios
2. Un examen que se administró a nivel nacional tuvo una media de 500 y una desviación estándar de 100. Si el puntaje z normal de un estudiante en este examen fue de 1.8, ¿cuál es su calificación en el examen?
Estadística Básica
Ejercicios
3. ¿Qué valor x tiene el mayor valor con respecto al conjunto de datos del que proviene?
• X=85, donde la media = 72 y la desviación estándar = 8
• X=93, donde la media = 87 y la desviación estándar = 5
Estadística Básica
Ejercicios
4. Considere el siguiente conjunto de tiempos de ignición que fueron registrados para una tela sintética
Encuentre: a) La mediana, b) El rango medio, c) El cuartil medio, c) Q2
30,1 30,1 30,2 30,5 31,0 31,1 31,2 31,3 31,431,5 31,6 31,6 32,0 32,4 32,5 33,0 33,0 33,534,0 34,5 34,5 35,0 35,0 35,6 36,5 36,9 37,037,5 37,5 37,6 38,0 39,5
Estadística Básica
Ejercicios
5. ¿Qué valor x tiene la menor posición relativa con respecto al conjunto de datos del que proviene?
• X=28, donde la media = 25.7 y la desviación estándar = 1.8
• X=39.2, donde la media = 34.1 y la desviación estándar = 4.3
Estadística Básica
Teorema de Chebyshev
La proporción de cualquier distribución que esté a menos de k desviaciones estándar de la media es por lo menos
Donde k es cualquier número positivo mayor que 1. Este teorema es válido para todas las distribuciones de datos.
2
11k
Estadística Básica
Teorema de Chebyshev
Este teorema establece que a menos de dos desviaciones estándar de la media (k = 2) siempre se encontrará por lo menos el 75% (o más) de los datos.
s
xX-2s X+2s
Por lo menos el 75%
Top Related