Estadística Básica

32
ESTADÍSTICA

Transcript of Estadística Básica

ESTADÍS

TICA

CONCEPTO DE ESTADÍSTICA

Observación

Registro

Organización

Síntesis

Análisis e interpretación

Predicción y/o conclusión

TIP

OS

DE

ES

TD

ISTIC

A

Descriptiva(deductiva)

Inferencial (inductiva)

DEFINICIONES ESTADÍSTICAS

Población: Colección objetos sobre los cuales se hacen mediciones mas el conjunto de mediciones en si mismas.

Muestra.Es una colección de mediciones seleccionadas de una población de interés.

Medición:Asignación de valores numéricos o dimensiones a un objeto u objetos mediante la utilización de determinados procedimientos.

Variable: Característica observable o a un aspecto discernible en un objeto de estudio, que puede adoptar diferentes valores o expresarse en varias categorías (cualitativa o cuantitativa). Para clasificar o categorizar variables, se utilizan diferentes tipos de escalas.

Escala Nominal:Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los objetos o fenómenos

Escala ordinal:Se establecen posiciones relativas de los objetos o fenómenos en estudio, respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.

Escala de intervalos: Medición más precisa. No solo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los intervalos o las diferentes categorías o clases.

Escala de razón: Tiene todas las características de una escala de intervalo y además un punto cero real en su origen

HERRAMIENTAS DE LA ESTADÍSTICA

Diagrama de puntos

Ejemplo: Se toman 10 mediciones del diámetro interno de los tornillos para los pistones del motor de un automóvil. Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000, 74.002, 74.005, 74.001, 74.001, 74.002 y 74.004. El diagrama de puntos correspondiente se presenta en la figura.

Diagrama de tallos y hojasEjemplo: La siguiente tabla representa el porcentaje de algodón en un

material utilizado para la fabricación de camisas para caballeros.

Grupo sanguíneo

fi

A 6

B 4

AB 1

0 9

  20

Ejemplo Diagrama de barras: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado:

Ejemplo Diagrama de Pastel: En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte.

  Alumnos Ángulo

Baloncesto 12 144°

Natación 3 36°

Fútbol 9 108°

Sin deporte 6 72°

Total 30 360°

Ejemplo Histograma:

El peso de 65 personas adultas viene dado por la siguiente tabla:

  ci fi Fi

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

[110, 120) 115 2 65

 

TAMAÑO DE MUESTRA

La muestra es el número de elementos, elegidos o no al azar, que hay que tomar de un universo para que los resultados puedan extrapolarse al mismo, y con la condición de que sean representativos de la población.

El tamaño de la muestra depende de tres aspectos:

• Del error permitido.

• Del nivel de confianza con el que se desea el error.

• Del carácter finito o infinito de la población.

TABLA DE APOYO AL CÁLCULO DEL TAMAÑO DE UNA MUESTRA POR NIVELES DE CONFIANZA

 Certeza 95% 94% 93% 92% 91% 90% 80%62.27

% 50%

Z1.96 1.88 1.81 1.75 1.69 1.65 1.28 1 0.6745

3.84 3.53 3.28 3.06 2.86 2.72 1.64 1.00 0.45

e 0.05 0.06 0.07 0.08 0.09 0.10 0.20 0.37 0.50

0.0025 0.0036 0.0049 0.0064 0.0081 0.01 0.04 0.1369 0.25

CALCULO DE LA MUESTRA• Para poblaciones infinitas (más de 100.000 habitantes):

n

• Para poblaciones finitas (menos de 100.000 habitantes):

Leyenda:

n = Número de elementos de la muestra.

N = Número de elementos del universo.

p/q = Probabilidades con las que se presenta el fenómeno.

Z = Valor crítico correspondiente al nivel de confianza elegido; siempre se opera con valor sigma 2, luego Z = 2.

e = Margen de error permitido (a determinar por el director del estudio).

Cuando el valor de P y de Q no se conozca, o cuando la encuesta se realice sobre diferentes aspectos en los que estos valores pueden ser diferentes, es conveniente tomar el caso más favorable, es decir, aquel que necesite el máximo tamaño de la muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50.

EJEMPLO 1 (valor Z = 2)

Población infinita. España tiene 44.000.000 de habitantes. En una investigación de mercados que se está realizando en España, se desea conocer entre otras cosas el número de personas que estarían dispuestas a trasladarse a vivir a otro país de la Comunidad Económica Europea. ¿Cuál será el tamaño de la muestra a estudiar para un nivel de confianza de la encuesta del 95,5 por 100 y un margen de posible error del ± 4 por 100?

n

n = x 50 x 50

n= = 625 personas

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

Pasos.

1. Toma de datos

2. Ordenación de datos

3. Calculo de rango (R), intervalo (clase C) y tamaño de clase

R= LS-LI

C= 1 + 3.332log (n) (aprox al menor)

Tamaño de clase = R/C

4. Construcción tabla de frecuencias.

EJEMPLO TABLA DE FRECUENCIA

3. Cálculo de rango, intervalo y tamaño de claseR= LS-LIR= 12-1 = 11

C = 1 + 3.332log (n) C = 1+3,332log (50)C = 6,666C = 6

Tamaño de clase = R/C = 11/6 = 2

Edades de alumnos de quinto grado del colegio san Bartolomé.

4. Construcción tabla de frecuencias

CLASEFRECUENCIA ABSOLUTA (FA)

FRECUENCIA RELATIVA (f) % f

Acumulado del % f X (LRI+LRS/2) FA*X

LRI LRS1 0,95 2,95 8 0,16 16 16 1,95 15,62 2,95 4,95 11 0,22 22 38 3,95 43,453 4,95 6,95 10 0,2 20 58 5,95 59,54 6,95 8,95 10 0,2 20 78 7,95 79,55 8,95 10,95 5 0,1 10 88 9,95 49,756 10,95 12,95 6 0,12 12 100 11,95 71,7

∑ 50 1 41,7 319,5

INTERVALO

TABLA DE FRECUENCIAS

MEDIDAS DE TENDENCIA CENTRALMedia (Datos sin agrupar)

Media (Datos agrupados)

Para el ejemplo:

𝜇=∑ 𝐹𝐴∗𝑋

Media = 319,5/50 = 6,39

El promedio de edad de los alumnos es de 6 años

EJEMPLO MEDIA

MEDIANADatos no agrupados impares y pares

En datos pares se promedian los dos datos que dividen en dos partes iguales.

Ejemplo mediana datos agrupados: Como los datos son 90 (número par) la mediana esta localizada entre la observación cuadragésima quinta y cuadragésima sexta (45a y 46a) que corresponde al intervalo entre 15.7 y 19.7 como se muestra en la tabla con una FRAi que contiene el 50% de datos acumulados:

Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.

MEDIANA

Cálculo de la mediana para datos agrupados : La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Li es el límite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

Ejemplo: Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

  fi Fi

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

 

100/2 = 50Clase de la mediana: [66, 69)

La mitad de los datos se encuentran por debajo de 67,93 y la mitad por encima.

MODADatos no agrupados

Es el valor que mas se repite

Datos agrupados

En una tabla de frecuencias, la moda se define como el valor medio de la clase cuya frecuencia tiene el valor numérico mayor, la cual recibe el nombre de clase modal.

Ejemplo:

Moda (Mo) = 17.7 que es el punto medio del intervalo donde la frecuencia absoluta (24) es mayor que los demás, y es de tipo unimodal.

MEDIDAS DE VARIABILIDADLA VARIANZA Y LA DESVIACIÓN STANDAR

Se puede definir como el "casi promedio" de los cuadrados de las desviaciones de los datos con respecto a la media muestral. Su formula matemática para el caso de datos referentes a una muestra es:

Datos

Datos agrupados

La desviación estándar es la raíz cuadrada de la varianza y es una medida del grado de dispersión de los datos con respecto al valor promedio.

Una desviación estándar grande indica que los puntos están lejos de la media y una desviación pequeña indica que los datos están agrupados cerca de la media.

EJEMPLO DE VARIANZA

Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

  xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

    42 1 820 88 050

Ejemplo: Calcular la varianza de la distribución de la tabla:

El promedio es de 43,33 La varianza es de 218,94La desviación estándar es de 14,796

Media.

Varianza

Desviación estándar

Ơ =

Ơ =

Ơ = 14,796

COEFICIENTE DE VARIACIÓN

El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

Ejemplo: Una distribución tiene x (promedio) = 140 y σ (desviación estándar)= 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?

GRACIAS¡¡¡

¡Rubén GutiérrezJuan JaramilloNelson CastroJohanna AyalaPaola Ardila