Estadistica descriptiva1 (1)

download Estadistica descriptiva1 (1)

of 34

Embed Size (px)

Transcript of Estadistica descriptiva1 (1)

  1. 1. Estadstica Descriptiva Textos guas Estadstica para Ingenieros y cientficos William Navidi McGrawHill Estadstica y Probabilidad. Montgomery Henry Lamos D 8/6/2015 Estadstica Descriptiva. Doctor en Matemticas Lamos H 1
  2. 2. Evaluaciones 8/6/2015 Estadstica Descriptiva. Doctor en Matemticas Lamos H 2 Tres previos I. Estadstica descriptiva y probabilidad + Trabajo 0.3 II. Variables aleatorias. Distribuciones de probabilidad + trabajo. 0.35 III. Modelado Estadstico + trabajo 0.35 IV. El peso del previo y del trabajo es igual
  3. 3. 8/6/2015 Estadstica Descriptiva. Doctor en Matemticas Lamos H 3 BIG DATA
  4. 4. 8/6/2015 Estadstica Descriptiva. Doctor en Matemticas Lamos H 4
  5. 5. 1-1 Proceso de asignar nmeros o etiquetas a las cosas, segn reglas especificas, para representar atributos de cantidad o calidad http://proexpansion.com/es/article s/615-big-data-los-desafios-del- uso-de-datos-masivos Medir lo que es medible y tratar de hacer medible lo que todava no lo es. Galileo Galilei Todas las verdades son fciles de entender, una vez descubiertas. La cuestin es descubrirlas. 8/6/2015 5 Estadstica Descriptiva. Doctor en Matemticas Lamos H Escalas de medicin
  6. 6. NOMINAL. Los datos son categoras mutuamente excluyentes. Los nmeros que se asignan a objetos o fenmenos son nombres o clasificaciones, solo son etiquetas. Sexo (masculino, femenino) se le asigna 0 a masculino y 1 a femenino. rea geogrfica (urbana , rural ) 8/6/2015 6 Estadstica Descriptiva. Doctor en Matemticas Lamos H Escalas de medicin
  7. 7. ORDINAL. En la escala se introduce un orden. Los nmeros ordinales se emplean para indicar orden de clasificacin. Nivel de medicin ordinal. Ordene de mayor a menor preferencia hacia los siguientes sabores de gaseosas de postobon Uva ____ Naranja _____ Kola ____ Qu factores tuvo en cuenta en la seleccin de la entidad bancaria a la hora de adquirir alguno de sus productos. (Ordene numricamente en grado de importancia, donde 1 es ms importante que 2 y as sucesivamente) 8/6/2015 7 Estadstica Descriptiva. Doctor en Matemticas Lamos H Escalas de medicin
  8. 8. ESCALA DE INTERVALO. Los nmeros se utilizan para clasificar objetos, de manera que las distancias numricamente iguales en la escala representan distancias iguales en la caracterstica que se mide. Las preferencias por los 10 supermercados en Colombia en una escala de 7 Carulla recibe 6 y Jumbo 2, no significa que Carulla se prefiera 3 veces mas que Jumbo. Carulla 6 Jumbo 2 8/6/2015 8 Estadstica Descriptiva. Doctor en Matemticas Lamos H Escalas de medicin
  9. 9. ESCALA DE RAZON. Tiene todas las propiedades de las anteriores y adems punto cero absoluto. Con esta escala podemos clasificar los objetos, ordenarlos y comparar diferencias. Estatura edad, peso, presin, permeabilidad, voltaje, ventas, participacin de mercado. 8/6/2015 9 Estadstica Descriptiva. Doctor en Matemticas Lamos H Escalas de medicin
  10. 10. 10 Ingresos Compra de Lacteos (Mensual) Tamao de la Familia N. de nios menores de 10 aos Estrato Nivel de Educacion Cabeza de Hogar 3000000 150000 4 0 2TECNOLOGO 4000000 80000 4 0 4UNIVERSITARIO 4500000 250000 4 2 4UNIVERSITARIO 2500000 40000 3 0 4BACHILLER 4000000 85000 4 0 5UNIVERSITARIO 2000000 100000 4 0 2UNIVERSITARIO 4000000 150000 4 1 3UNIVERSITARIO 1500000 50000 5 0 1BACHILLERATO 4300000 100000 5 0 4UNIVERSITARIO 2500000 180000 3 0 3UNIVERSITARIO 3500000 220000 6 1 3Bachiller 2000000 140000 3 1 3UNIVERSITARIO Tabla de datos estructurados
  11. 11. La media y la varianza de la poblacin son parmetros de posicin y dispersin. Valor de resumen, un representante de los datos. La media se define como la suma de todos los valores ponderados por 1/N; N es el tamao de la poblacin: N x N 1i i 3-2 11 Estadstica Descriptiva. Doctor en Matemticas Lamos H poblacinladeTamao-N )( = 2N 1i2 N xxi 8/6/2015 Medidas de resumen
  12. 12. 11.0 61.1 2 8/6/2015 12 Estadstica Descriptiva. Doctor en Matemticas Lamos H Un ejemplo. Ventas anuales medicin
  13. 13. 8/6/2015 Estadstica Descriptiva. Doctor en Matemticas Lamos H 13 YYXX XY x y i R x N x XY i raznllamase 0 ticacaracterslatienesi-1 N 1i = Parmetros: Proporcin, Razn, Correlacin
  14. 14. 06/08/2015 14Henry Lamos Ph.D en Matemticas Medidas de posicin: media de una muestra Suponga que se tienen los siguientes datos 1, 2, . . , de una muestra. Se define el siguiente valor llamado media aritmtica = 1+. . + La edad en meses de 5 perros de estudiantes de Ingeniera Industrial se presenta a continuacin: 2, 5, 7, 9, 36 = 2+5+7+9+36 5 = 11.8
  15. 15. 06/08/2015 15Henry Lamos Ph.D en Matemticas La mediana de una muestra Suponga que se tienen los siguientes datos 1, 2, . . , de una muestra. Se ordena la muestra en orden ascendente, sea el orden (1), (2), . . , () La mediana se define comoel siguiente valor llamado media aritmtica = ( +1 2 ) si n es impar, en caso contrario = ( 2 ) + 2 +1 2 La edad en meses de 5 perros de estudiantes de Ingeniera Industrial se presenta a continuacin: 2, 5, 7, 9, 36 = 7
  16. 16. Todo conjunto de datos de nivel de intervalo y de nivel de razn tiene un valor medio. 8/6/2015 16 Estadstica Descriptiva. Doctor en Matemticas Lamos H Propiedades de la media Al evaluar la media se incluyen todos los valores. Un conjunto de valores slo tiene una media. La cantidad de datos a evaluar rara vez afecta la media. La media es la nica medida de ubicacin donde la suma de las desviaciones de cada valor con respecto a la media, siempre es cero.
  17. 17. La mediana es nica para cada conjunto de datos. 8/6/2015 17 Estadstica Descriptiva. Doctor en Matemticas Lamos H Propiedades de la mediana No se ve afectada por valores muy grandes o muy pequeos, y por lo tanto es una medida valiosa de tendencia central cuando ocurren. Puede obtenerse para datos de nivel de razn, de intervalo y ordinal. Puede calcularse para una distribucin de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.
  18. 18. La funcin de masa de probabilidad condicional Moda La moda es el valor de la observacin que aparece con ms frecuencia. EJEMPLO 5: las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificacin 81 es la que ms ocurre, la moda es igual 81.
  19. 19. La funcin de masa de probabilidad condicional Media Geomtrica La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la raz n-sima del producto de los n valores. Su frmula es: La media geomtrica se usa para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento. n nXXXXMG ))...()()(( 321
  20. 20. La funcin de masa de probabilidad condicional Media Geomtrica. Ejemplo Las tasas de inters de tres bonos son 5%, 7% y 4%. 3 )4)(5)(7(MG La media aritmtica es (5 + 7 + 4)/3 = 5.333 La MG da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la tasa de 7%.
  21. 21. 8/6/2015 21 Estadstica Descriptiva. Doctor en Matemticas Lamos H Medidas de variabilidad minmax max min ,..,max ,..,min xxR xxxx xxxx n21 n21 Recorrido : Para un conjunto de datos se halla el mayor valor y el menor valor
  22. 22. 8/6/2015 22 Estadstica Descriptiva. Doctor en Matemticas Lamos H Medidas de dispersin Desviacin media: media aritmtica de los valores absolutos de las desviaciones respecto a la media aritmtica. Sea las calificaciones de un examen de diez estudiantes son: 3.5, 4.3, 3.8, 3.7, 3.6, 3.8, 3.9, 3.5, 3.5, 3.8. La media es 3.74, por lo tanto, las desviaciones seran: -0.24, 0.56,0.06l luego se calcula el promedio de las desviaciones en valor absoluto, N 1i i N x XDMA )(
  23. 23. La funcin de masa de probabilidad condicional Varianza La varianza poblacional es el promedio de las desviaciones cuadrticas. Se llama desviacin cuadrtica a 2 i 2 i xd )( La varianza se denota con la letra sigma al cuadrado 2 2 2 i 2 i N 1i 2 N x N x )(
  24. 24. La varianza muestral estima la varianza de la poblacin. n xx s n x s i i )( = 1 )x-( = n 1i2 2 i2 La desviacin estndar muestral es la raz cuadrada de la varianza muestral. la amplitud o rango es la diferencia entre los valores mayor y menor en un conjunto de datos. 4-11 8/6/2015 24 Estadstica Descriptiva. Doctor en Matemticas Lamos H Estimaciones de la desviacin media absoluta y de la varianza
  25. 25. El coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica, expresada como porcentaje: CV s X (100%) 4-17 8/6/2015 25 Estadstica Descriptiva. Doctor en Matemticas Lamos H Coeficiente de variacin
  26. 26. Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 1/k2, donde k2 es una constante mayor que 1. 8/6/2015 26 Estadstica Descriptiva. Doctor en Matemticas Lamos H Interpretacin y usos de la desviacin estndar
  27. 27. 27 Hora 8.30 am 9.30 am 10.30 am 11.30 am 12.30 am Muestra 1 2 3 4 5 6 x1 33 33 35 30 33 38 x2 29 31 37 31 34 37 x3 31 35 33 33 35 39 x4 32 37 34 34 33 40 x5 33 31 36 33 34 38 Promedio 31,6 33,4 35 32,2 33,8 38.4 R 4 6 4 4 2 3 La pieza de una turbina de avin se fabrica mediante un proceso de colada de precisin. La abertura del aspa en este vaciado es un parmetro funcional importante de la pieza. En la tabla se presenta 6 de las 20 muestras que se encuentran en el archivo oberturas de cinco piezas. Los valores dados se han codificado usando los tres ltimos dgitos de la dimensin, esto es, 31.6 debera ser 0.50316 pulgadas Dimetro de una pieza
  28. 28. 28 Dimetro de una pieza Muestra x1 x2 x3 x4 x5 1 33 29 31 32 33 2 33 31 35 37 31 3 35 37 33 34 36 4 30 31 33 34 33 5 33 34 35 33 34 6 38 37 39 40 38 7 30 31 32 34 31 8 29 39 38 39 39 9 28 33 35 36 43 10 38 33 32 35 32 11 28 30 28 32 31 12 31