Estadística Básica
Transcript of Estadística Básica
CONCEPTO DE ESTADÍSTICA
Observación
Registro
Organización
Síntesis
Análisis e interpretación
Predicción y/o conclusión
DEFINICIONES ESTADÍSTICAS
Población: Colección objetos sobre los cuales se hacen mediciones mas el conjunto de mediciones en si mismas.
Muestra.Es una colección de mediciones seleccionadas de una población de interés.
Medición:Asignación de valores numéricos o dimensiones a un objeto u objetos mediante la utilización de determinados procedimientos.
Variable: Característica observable o a un aspecto discernible en un objeto de estudio, que puede adoptar diferentes valores o expresarse en varias categorías (cualitativa o cuantitativa). Para clasificar o categorizar variables, se utilizan diferentes tipos de escalas.
Escala Nominal:Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los objetos o fenómenos
Escala ordinal:Se establecen posiciones relativas de los objetos o fenómenos en estudio, respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.
Escala de intervalos: Medición más precisa. No solo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los intervalos o las diferentes categorías o clases.
Escala de razón: Tiene todas las características de una escala de intervalo y además un punto cero real en su origen
HERRAMIENTAS DE LA ESTADÍSTICA
Diagrama de puntos
Ejemplo: Se toman 10 mediciones del diámetro interno de los tornillos para los pistones del motor de un automóvil. Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000, 74.002, 74.005, 74.001, 74.001, 74.002 y 74.004. El diagrama de puntos correspondiente se presenta en la figura.
Diagrama de tallos y hojasEjemplo: La siguiente tabla representa el porcentaje de algodón en un
material utilizado para la fabricación de camisas para caballeros.
Grupo sanguíneo
fi
A 6
B 4
AB 1
0 9
20
Ejemplo Diagrama de barras: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado:
Ejemplo Diagrama de Pastel: En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte.
Alumnos Ángulo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°
Ejemplo Histograma:
El peso de 65 personas adultas viene dado por la siguiente tabla:
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
TAMAÑO DE MUESTRA
La muestra es el número de elementos, elegidos o no al azar, que hay que tomar de un universo para que los resultados puedan extrapolarse al mismo, y con la condición de que sean representativos de la población.
El tamaño de la muestra depende de tres aspectos:
• Del error permitido.
• Del nivel de confianza con el que se desea el error.
• Del carácter finito o infinito de la población.
TABLA DE APOYO AL CÁLCULO DEL TAMAÑO DE UNA MUESTRA POR NIVELES DE CONFIANZA
Certeza 95% 94% 93% 92% 91% 90% 80%62.27
% 50%
Z1.96 1.88 1.81 1.75 1.69 1.65 1.28 1 0.6745
3.84 3.53 3.28 3.06 2.86 2.72 1.64 1.00 0.45
e 0.05 0.06 0.07 0.08 0.09 0.10 0.20 0.37 0.50
0.0025 0.0036 0.0049 0.0064 0.0081 0.01 0.04 0.1369 0.25
CALCULO DE LA MUESTRA• Para poblaciones infinitas (más de 100.000 habitantes):
n
• Para poblaciones finitas (menos de 100.000 habitantes):
Leyenda:
n = Número de elementos de la muestra.
N = Número de elementos del universo.
p/q = Probabilidades con las que se presenta el fenómeno.
Z = Valor crítico correspondiente al nivel de confianza elegido; siempre se opera con valor sigma 2, luego Z = 2.
e = Margen de error permitido (a determinar por el director del estudio).
Cuando el valor de P y de Q no se conozca, o cuando la encuesta se realice sobre diferentes aspectos en los que estos valores pueden ser diferentes, es conveniente tomar el caso más favorable, es decir, aquel que necesite el máximo tamaño de la muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50.
EJEMPLO 1 (valor Z = 2)
Población infinita. España tiene 44.000.000 de habitantes. En una investigación de mercados que se está realizando en España, se desea conocer entre otras cosas el número de personas que estarían dispuestas a trasladarse a vivir a otro país de la Comunidad Económica Europea. ¿Cuál será el tamaño de la muestra a estudiar para un nivel de confianza de la encuesta del 95,5 por 100 y un margen de posible error del ± 4 por 100?
n
n = x 50 x 50
n= = 625 personas
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Pasos.
1. Toma de datos
2. Ordenación de datos
3. Calculo de rango (R), intervalo (clase C) y tamaño de clase
R= LS-LI
C= 1 + 3.332log (n) (aprox al menor)
Tamaño de clase = R/C
4. Construcción tabla de frecuencias.
EJEMPLO TABLA DE FRECUENCIA
3. Cálculo de rango, intervalo y tamaño de claseR= LS-LIR= 12-1 = 11
C = 1 + 3.332log (n) C = 1+3,332log (50)C = 6,666C = 6
Tamaño de clase = R/C = 11/6 = 2
Edades de alumnos de quinto grado del colegio san Bartolomé.
4. Construcción tabla de frecuencias
CLASEFRECUENCIA ABSOLUTA (FA)
FRECUENCIA RELATIVA (f) % f
Acumulado del % f X (LRI+LRS/2) FA*X
LRI LRS1 0,95 2,95 8 0,16 16 16 1,95 15,62 2,95 4,95 11 0,22 22 38 3,95 43,453 4,95 6,95 10 0,2 20 58 5,95 59,54 6,95 8,95 10 0,2 20 78 7,95 79,55 8,95 10,95 5 0,1 10 88 9,95 49,756 10,95 12,95 6 0,12 12 100 11,95 71,7
∑ 50 1 41,7 319,5
INTERVALO
TABLA DE FRECUENCIAS
MEDIDAS DE TENDENCIA CENTRALMedia (Datos sin agrupar)
Media (Datos agrupados)
Para el ejemplo:
𝜇=∑ 𝐹𝐴∗𝑋
Media = 319,5/50 = 6,39
El promedio de edad de los alumnos es de 6 años
MEDIANADatos no agrupados impares y pares
En datos pares se promedian los dos datos que dividen en dos partes iguales.
Ejemplo mediana datos agrupados: Como los datos son 90 (número par) la mediana esta localizada entre la observación cuadragésima quinta y cuadragésima sexta (45a y 46a) que corresponde al intervalo entre 15.7 y 19.7 como se muestra en la tabla con una FRAi que contiene el 50% de datos acumulados:
Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.
MEDIANA
Cálculo de la mediana para datos agrupados : La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Li es el límite inferior de la clase donde se encuentra la mediana.
es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
Ejemplo: Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100/2 = 50Clase de la mediana: [66, 69)
La mitad de los datos se encuentran por debajo de 67,93 y la mitad por encima.
MODADatos no agrupados
Es el valor que mas se repite
Datos agrupados
En una tabla de frecuencias, la moda se define como el valor medio de la clase cuya frecuencia tiene el valor numérico mayor, la cual recibe el nombre de clase modal.
Ejemplo:
Moda (Mo) = 17.7 que es el punto medio del intervalo donde la frecuencia absoluta (24) es mayor que los demás, y es de tipo unimodal.
MEDIDAS DE VARIABILIDADLA VARIANZA Y LA DESVIACIÓN STANDAR
Se puede definir como el "casi promedio" de los cuadrados de las desviaciones de los datos con respecto a la media muestral. Su formula matemática para el caso de datos referentes a una muestra es:
Datos
Datos agrupados
La desviación estándar es la raíz cuadrada de la varianza y es una medida del grado de dispersión de los datos con respecto al valor promedio.
Una desviación estándar grande indica que los puntos están lejos de la media y una desviación pequeña indica que los datos están agrupados cerca de la media.
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
Ejemplo: Calcular la varianza de la distribución de la tabla:
El promedio es de 43,33 La varianza es de 218,94La desviación estándar es de 14,796
Media.
Varianza
Desviación estándar
Ơ =
Ơ =
Ơ = 14,796
COEFICIENTE DE VARIACIÓN
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
Ejemplo: Una distribución tiene x (promedio) = 140 y σ (desviación estándar)= 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?
BIBLIOGRAFÍA CONSULTADA
http://www.monografias.com/trabajos60/tamano-muestra-archivistica/tamano-muestra-archivistica2.shtml?monosearch
http://www.spssfree.com/spss/analisis2.html
http://www.galeon.com/colposfesz/est501/distfrec/mtcent/mtcent.htm
http://www.tuveras.com/estadistica/estadistica02.htm#md
http://www.vitutor.com/estadistica/descriptiva/a_10.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001065/index.html