1. Estadistica Descriptiva VERANO 2014

92
PROBABILIDAD Y ESTADISTICA MC Aída Salazar Compañ [email protected] PROBABILIDAD Y ESTADISTICA. 1

Transcript of 1. Estadistica Descriptiva VERANO 2014

Page 1: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA

MC Aída Salazar Compañ[email protected]

PROBABILIDAD Y ESTADISTICA. 1

Page 2: 1. Estadistica Descriptiva VERANO 2014

Aplicaciones de la Estadística

Media 5.676

Error estándar 1.4956

Mediana 3.4

Moda 2

Desviación Estándar 7.47

Varianza Muestral 55.92

Curtosis 16.13

Sesgo 3.806

Amplitud de la variación 36.5

Mínimo 1.8

Máximo 38.3

Suma 141.9

Conteo 25

La tabla siguiente posee el resumen de una población. ¿Qué podría decir acerca de los datos, son simétricos o sesgados?

Page 3: 1. Estadistica Descriptiva VERANO 2014

• La señora Katy Ball de AutoUSA quería desarrollar algunas tablas y gráficas para mostrar el precio de venta típico en diversas distribuidoras. La siguiente tabla reporta sólo el precio de los 80 vehículos vendidos el mes pasado en Whitner Autoplex.

a. ¿Cuál es el precio de venta típico?

b. ¿Cuál es el precio de venta más alto ?c. ¿Cuál es el precio de venta más bajo?d. ¿Alrededor de qué valor tienden a agruparse los precios de venta?

$23 197 23 372 20 454 23 591 26 651 27 453 17 26618 021 28 683 30 872 19 587 23 169 35 851 19 25120 047 24 285 24 324 24 609 28 670 15 546 15 93519 873 25 251 25 277 28 034 24 533 27 443 19 88920 004 17 357 20 155 19 688 23 657 26 613 20 89520 203 23 765 25 783 26 661 32 277 20 642 21 98124 052 25 799 15 794 18 263 35 925 17 399 17 96820 356 21 442 21 722 19 331 22 817 19 766 20 63320 962 22 845 26 285 27 896 29 076 32 492 18 89021 740 22 374 24 571 25 449 28 337 20 642 23 61324 220 30 655 22 442 17 891 20 818 26 237 20 44521 556 21 639 24 296

Page 4: 1. Estadistica Descriptiva VERANO 2014

EJEMPLO

• Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide:

a. La probabilidad de que salga el 7. b.La probabilidad de que el número obtenido

sea par. c. La probabilidad de que el número obtenido

sea múltiplo de tres.

PROBABILIDAD Y ESTADISTICA. 4

Page 5: 1. Estadistica Descriptiva VERANO 2014

• Si se contesta sin pensar un test de 10 preguntas en las que hay que contestar si es cierto o falso.

a. ¿Cuál es la probabilidad de acertar el 70 % o más de las preguntas?, b. ¿y exactamente 7 de las 10 respuestas?

• El tiempo de reparación de unas máquinas de escribir tiene una distribución aproximadamente exponencial, con media 22 minutos.

a. Hallar la probabilidad de que el tiempo de reparación sea menor que diez minutos.

b. El costo de reparación es de 2000 pts. por cada media hora o fracción. ¿Cuál es la probabilidad de que una reparación cueste 4000 pts?

PROBABILIDAD Y ESTADISTICA. 5

Page 6: 1. Estadistica Descriptiva VERANO 2014

• Una empresa de material eléctrico fabrica bombillas de luz que tienen una duración aproximadamente distribuida de forma normal, con una desviación estándar de 40 horas. Si una muestra de 30 bombillas tiene una duración promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la población de todas las bombillas que produce esta empresa.

PROBABILIDAD Y ESTADISTICA. 6

Se comparan las resistencias de dos clases de hilo. Cincuenta piezas de cada clase de hilo se prueban bajo condiciones similares. La marca A tiene una resistencia a la tensión promedio de 78.3 kilogramos con una desviación estándar de 5.6 kilogramos; en tanto que la marca B tiene una resistencia a la tensión promedio de 87.2 kilogramos con una desviación estándar de 6.3 kilogramos. Construye un intervalo de confianza de 95% para la diferencia de las medias poblacionales.

Page 7: 1. Estadistica Descriptiva VERANO 2014

Intención del curso

• Es un curso de nivel básico que tiene la intención de desarrollar en el alumno su capacidad de abstracción y la habilidad de resolución de problemas. Esto se logrará mediante la exposición a problemas que involucran incertidumbre en una o varias dimensiones, expresándolos y explicándolos en términos de probabilidad y estadística y a partir de esto encontrando soluciones de los mismos.

PROBABILIDAD Y ESTADISTICA. 7

Page 8: 1. Estadistica Descriptiva VERANO 2014

Objetivos Generales

Al finalizar el alumno será capaz de:• 1.       Comprender los conceptos básicos de

probabilidad y solución a problemas con técnicas de conteo, probabilidad condicional, variables aleatorias discretas y continuas y sus distribuciones

• 2.       Analizar un conjunto de datos experimentales y sacar inferencia estadísticas de los datos.

PROBABILIDAD Y ESTADISTICA. 8

Page 9: 1. Estadistica Descriptiva VERANO 2014

TEMAS Y SUBTEMAS DEL CURSO

1. Estadística descriptiva 1.1 Experimentación1.2 Presentación de Datos1.3 Medidas Estadísticas

2. Teoría de probabilidad 2.1 Probabilidad2.2 Probabilidades de eventos simples y compuestos 2.3 Técnicas de Conteo2.4 Probabilidad Condicional e independencia de eventos2.5 Teorema de Bayes

PROBABILIDAD Y ESTADISTICA. 9

Page 10: 1. Estadistica Descriptiva VERANO 2014

3. Variables aleatorias 3.1 Variables Aleatorias Discretas3.2 Variables Aleatorias Continuas3.3 Valor Esperado y Varianza de una Variable Aleatoria3.4 Bernoulli y Binomial3.5 Geométrica y Binomial negativa.3.6 Hipergeométrica3.7 Poisson3.8 Distribución Uniforme

3.9 Distribución Normal3.10 Distribución Gama y Exponencial

3.11 Distribución Weibull

PROBABILIDAD Y ESTADISTICA. 10

Page 11: 1. Estadistica Descriptiva VERANO 2014

4. Estadística Inferencial Básica4.1 Distribuciones Relacionadas con la Distribución Normal • t-Student, • Ji(chi)-Cuadrada y • F de Fisher-Snedecor 4.2 Estimadores Puntuales4.3 Propiedades de los Estimadores Puntuales4.4 Distribuciones muestrales4.5 Intervalos de Confianza para una población

4.6 Pruebas de Hipótesis para una población

PROBABILIDAD Y ESTADISTICA. 11

Page 12: 1. Estadistica Descriptiva VERANO 2014

BIBLIOGRAFÍAWACKERLY - MENDENHALL - SCHEAFFER

Estadística Matemática con Aplicaciones.7ª edición, México: CENGAGE LEARNING EDITORES , S.A. de C.V. 2010ISBN-10: 970-830-010-1

I. Devore, Jay L.

Probabilidad y estadística para ingeniería y ciencias 6a ed., México : International Thomson Editores, 2005.ISBN 970-686-457-1

II. Walpole, Ronald E.

Probabilidad y estadística para ingenieros 9a ed., México : Prentice-Hall, 1999.ISBN 970-17-0264-6

PROBABILIDAD Y ESTADISTICA. 12

Page 13: 1. Estadistica Descriptiva VERANO 2014

III. Navidi William.

Estadística para ingenieros y científicos. 1a ed., México : McGraw-Hill, 2006.ISBN 970-10-5629-9

IV. Ross Sheldon.

Probabilidad y Estadística para ingenieros. 2a ed., México : McGraw-Hill, 2002.ISBN 0-12-598472-3

PROBABILIDAD Y ESTADISTICA. 13

Page 14: 1. Estadistica Descriptiva VERANO 2014

V. Montgomery Douglas.

Diseño y Análisis de Experimentos. 2a ed., México : Limusa S.A. de C. V., 2004.ISBN 968-18-6156-6

VI. Box George E. P, Hunter William G., Hunter J. Stuart.

Estadística para investigadores. México : Reverté Ediciones, 2002.ISBN 968-6708-40-5

PROBABILIDAD Y ESTADISTICA. 14

Page 15: 1. Estadistica Descriptiva VERANO 2014

POLÍTICAS GENERALES Y CÓDIGO DE ÉTICA• Faltas. Lo señalado por el reglamento. Ninguna falta es justificable.• Inicio y fin de clase. Inicio: 5 minutos después de la hora señalada. Fin:

5 minutos antes de la hora señalada.• Tareas y actividades Las formas de entrega y evaluación se especifican

en cada una de ellas. Todas las tareas y actividades deberán ser entregadas en formato y tiempo de entrega señalados. No se califican tareas extemporáneas. Solo se calificarán tareas que cumplan con las instrucciones de formatos y colocación. No se califican prácticas en el salón de clase, ni exámenes rápidos a los alumnos que no asistan a la sesión en la que se lleven a cabo.

PROBABILIDAD Y ESTADISTICA. 15

Page 16: 1. Estadistica Descriptiva VERANO 2014

• Tareas y proyectos colaborativos de programación. Se realizarán tareas parciales de programación (medianas) y un proyecto final. Las especificaciones serán publicadas y establecidas en la plataforma. Todas las fechas de entrega son previamente definidas y NO serán modificadas.

• Exámenes parciales: Está estrictamente prohibido el uso de herramientas de correo electrónico, mensajería instantánea y teléfonos celulares durante los exámenes. Su uso causará inmediatamente la cancelación del examen y se hará acreedor a una calificación de cero.

• Examen final: 1 (teórico-práctico en fecha y hora establecidos por la oficina de servicios escolares)

PROBABILIDAD Y ESTADISTICA. 16

Page 17: 1. Estadistica Descriptiva VERANO 2014

POLITICAS DE EVALUACION

• Primer examen parcial 20% • Segundo examen parcial 20% • Tercer examen parcial 20% • Examen final 30%• Tareas 10%

PROBABILIDAD Y ESTADISTICA. 17

Exámenes Fechas de Examen JUNIOPrimer Parcial MIERCOLES 11 Segundo Parcial MIERCOLES 18

Tercer Parcial MIERCOLES 25

ULTIMO DIA DE CLASES VIERNES 4 DE JULIO

ASESORIAS MARTES Y JUEVES 13:00 – 14:00

Page 18: 1. Estadistica Descriptiva VERANO 2014

Razones para estudiar ESTADÍSTICA

• Se emplean técnicas estadísticas en casi todas las fases de la vida. La información está por todas partes.

• Sin importar cuál sea su profesión, tomará decisiones más profesionales que comprenden información.

• Se diseñan encuestas para recabar los primeros informes en día de elecciones y pronosticar el resultado de una elección .

• Se hacen muestreos de consumidores para obtener información para predecir preferencias de productos.

• Médicos investigadores realizan experimentos para determinar el efecto de diversos medicamentos y condiciones ambientales controladas en seres humanos para inferir el tratamiento adecuado para varias enfermedades.

PROBABILIDAD Y ESTADISTICA. 18

Page 19: 1. Estadistica Descriptiva VERANO 2014

Razones para estudiar ESTADÍSTICA

• Los ingenieros muestrean la característica de calidad de un producto y diversas variables de procesos controlables para identificar variables clave relacionadas con la calidad de un producto .

• Aparatos electrónicos recién manufacturados se muestrean antes de enviarlos para decidir si se embarcan o se mantienen lotes individuales.

• Los economistas observan varios índices del estado de la economía en un periodo y usan la información para pronosticar las condiciones de la economía en el futuro.

• Conceptos fundamentales de imágenes, operaciones básicas con pixeles, en sistemas de video los fundamentos de color.

PROBABILIDAD Y ESTADISTICA. 19

Page 20: 1. Estadistica Descriptiva VERANO 2014

ESTADÍSTICA

• La Estadística es una rama de las matemáticas que estudia la recolección, análisis, interpretación y presentación de masas de información numérica.

• La Estadística es la ciencia que se ocupa de la toma de decisiones bajo incertidumbre.

• La Estadística es una de las herramientas más ampliamente utilizadas en la investigación científica.

Page 21: 1. Estadistica Descriptiva VERANO 2014

La estadística se divide es dos ramas.

Estadística descriptiva: Parte de la estadística que trata con la obtención, ordenación y presentación de información en un proceso específico que presente variabilidad o incertidumbre.

Estadística Inferencial: Parte de la estadística que analiza la información de un proceso con el fin de emitir juicios que lleven a la mejora del proceso en si. La herramienta principal de la estadística inferencial es la probabilidad.

PROBABILIDAD Y ESTADISTICA. 21

Page 22: 1. Estadistica Descriptiva VERANO 2014

¿Cómo reunir la información en un proceso específico?

Estudio observacional: Donde los factores no pueden manejarse y simplemente se observa el comportamiento de tal proceso a través del tiempo.

Ejemplo: Observación del comportamiento de la energía eléctrica consumida en una planta en función de las condiciones ambientales.

Estudio experimental bien diseñado. Donde los factores pueden manejarse y controlarse y se observa el comportamiento del proceso en función de tales factores.

Ejemplo: Estudio sobre la corrosión en aluminio en función de la cantidad de sustancia retardadora en su recubrimiento, en una cierta cadena de producción.

PROBABILIDAD Y ESTADISTICA. 22

Page 23: 1. Estadistica Descriptiva VERANO 2014

¿Cómo se eligen los elementos a estudiar?

!De una buena elección de los elementos a estudiar dependerá la fuerza de las conclusiones respecto a la población en general!

Población: Conjunto de observaciones de todos los elementos sobre los cuales queremos obtener conclusiones o tomar decisiones.

Al estudio de toda la población se le llama CENSO.

Desventajas del censo: La población es muy grande, las características de la población pueden variar en el tiempo, puede resultar muy costoso y tardado.

PROBABILIDAD Y ESTADISTICA. 23

Page 24: 1. Estadistica Descriptiva VERANO 2014

Muestra: Subconjunto de individuos de una población.

!Se puede inferir información de la población total, estudiando la muestra!

!La muestra debe ser representativa de la población!

¿Cómo elegir tal muestra?

Aleatoriamente!!

PROBABILIDAD Y ESTADISTICA. 24

Page 25: 1. Estadistica Descriptiva VERANO 2014

Muestra aleatoria: Es un subconjunto representativo de la población, que se elige de tal forma que sea igualmente probable elegir esta muestra o cualquier otra.

PROBABILIDAD Y ESTADISTICA. 25

Población Muestra

EstadísticaInferencial

Probabilidad

Page 26: 1. Estadistica Descriptiva VERANO 2014

¿Elegida la muestra y tomados los datos, como los presentamos?

Organización de datos.Tipos de organización.• Arreglo: Colocar las observaciones en orden de magnitud, esto puede ser en orden

ascendente o descendente.

La organización de los datos generalmente implica el arreglo de las observaciones en clases, c.Al arreglo de los datos para expresar la frecuencia de ocurrencias de las observaciones en cada

una de estas se conoce como distribución de frecuencias.

• Distribución de frecuencias: Presentación de los datos distribuyéndolos en clases y categorías, se determina también las frecuencias (número de elementos que pertenecen a una clase) de las clases.

PROBABILIDAD Y ESTADISTICA. 26

Page 27: 1. Estadistica Descriptiva VERANO 2014

Ejercicio 1. La siguiente muestra tiene los ingresos ganados cierto sábado por los estudiantes universitarios que trabajan. Las datos están en dólares.

30, 11, 42, 8, 30, 18, 25, 25, 17, 30, 39, 21, 23, 25, 15, 35, 26, 13, 21, 26.¿Cómo organizarías los datos?

Solución.Arreglo: 8, 11, 13, 15, 17, 18, 21, 21, 23, 25, 25, 25, 26, 29, 30, 30, 30, 35, 36,

42.El ingreso más alto es de 42 dólares y el menor es de 8 dólares. La diferencia

entre los dos es de 34 dólares.

PROBABILIDAD Y ESTADISTICA. 27

Page 28: 1. Estadistica Descriptiva VERANO 2014

Reglas útiles para la selección de intervalos de clase¿Cómo seleccionamos los intervalos de las clases?Depende de los datos.

1. El número de clases no deberá de ser tan pequeño o tan grande que no permita ver la verdadera naturaleza de la distribución (aunque el número de clases crece conforme crece el número de datos).

2. Con frecuencia el número de intervalos de clase se elige como la raíz cuadrada del número de datos (o el entero más aproximado).

3. Los intervalos de clases deben ser del mismo ancho.4. La longitud de los intervalos de clase se obtienen dividiendo el rango entre el

número de clases.5. Los extremos de los intervalos de clase se llaman extremos de clase y sus puntos

medios se llaman marcas de clase.6. Los puntos medios o marca de la clase m, deberán ser valores fáciles de

manejar, con este fin es recomendable que la longitud de cada clase sea un número impar. Así, las marcas de clase tendrán los mismos dígitos que los datos.

PROBABILIDAD Y ESTADISTICA. 28

Page 29: 1. Estadistica Descriptiva VERANO 2014

Frecuencia absoluta. Es el número de veces que aparece en la muestra dicho valor de la variable .

(depende del tamaño de la muestra)Frecuencia relativa. Cociente entre la frecuencia absoluta y el tamaño de la

muestra .

(no depende del tamaño de la muestra)

Frecuencia absoluta acumulada. Es la suma de las frecuencias absolutas acumuladas para valores de la variable menores o iguales a el (requiere ordenar en forma creciente los datos).

in

Nn

f ii

PROBABILIDAD Y ESTADISTICA. 29

k

jji nN

1

Page 30: 1. Estadistica Descriptiva VERANO 2014

Frecuencia relativa acumulada. Es el cociente entre la frecuencia absoluta acumulada y el tamaño de la muestra.

N

NF ii

N

nk

ji

1

PROBABILIDAD Y ESTADISTICA. 30

Page 31: 1. Estadistica Descriptiva VERANO 2014

Diagrama de tallo y hojas. Es un diagrama de frecuencias donde la clase esta caracterizada como el valor entero del dato y la hoja está caracterizada por el valor decimal. Se señala además la frecuencia en tal clase.

PROBABILIDAD Y ESTADISTICA. 31

Tallo

Hoja Frecuencia

Page 32: 1. Estadistica Descriptiva VERANO 2014

Tabla de distribución de frecuencias. Es una tabla donde se muestra las clases en que se divide el rango, las marcas de clases, y las frecuencias absolutas y relativas.

PROBABILIDAD Y ESTADISTICA. 32

Page 33: 1. Estadistica Descriptiva VERANO 2014

Creación de una distribución de frecuencias

La estadística descriptiva se utiliza para organizar la información de diversas maneras, a fin de señalar el lugar donde los valores de los datos tienden a concentrarse y ayudar a distinguir los valores más altos y más bajos.

El primer paso que seguimos para describir un conjunto de datos es una distribución de frecuencias.

DISTRIBUCIÓN DE FRECUENCIAS.- Agrupación de los datos en clases mutuamente excluyentes mostrando el número de observaciones en cada una.

Page 34: 1. Estadistica Descriptiva VERANO 2014

¿Cómo desarrollamos una distribución de frecuencias?

EJERCICIO 1:• La señora Kathryn Ball de AutoUSA quería desarrollar algunas tablas y gráficas para

mostrar el precio de venta típico en diversas distribuidoras. La siguiente tabla reporta sólo el precio de los 80 vehículos vendidos el mes pasado en Whitner Autoplex. ¿Cuál es el precio de venta típico? ¿Cuál es el precio de venta más alto ? ¿Cuál es el precio de venta más bajo? ¿Alrededor de qué valor tienden a agruparse los precios de venta?

$23 197 23 372 20 454 23 591 26 651 27 453 17 26618 021 28 683 30 872 19 587 23 169 35 851 19 25120 047 24 285 24 324 24 609 28 670 15 546 15 93519 873 25 251 25 277 28 034 24 533 27 443 19 88920 004 17 357 20 155 19 688 23 657 26 613 20 89520 203 23 765 25 783 26 661 32 277 20 642 21 98124 052 25 799 15 794 18 263 35 925 17 399 17 96820 356 21 442 21 722 19 331 22 817 19 766 20 63320 962 22 845 26 285 27 896 29 076 32 492 18 89021 740 22 374 24 571 25 449 28 337 20 642 23 61324 220 30 655 22 442 17 891 20 818 26 237 20 44521 556 21 639 24 296

Page 35: 1. Estadistica Descriptiva VERANO 2014

A la información de la tabla sin organizar se la llama datos en bruto o datos no agrupados.

PASOS PARA ORGANIZAR UNA DISTRIBUCION DE FRECUENCIA.

Paso 1. Decidir el número de clases. El objetivo es utilizar suficientes grupos o El objetivo es utilizar suficientes grupos o clases para revelar la forma de la distribución.clases para revelar la forma de la distribución.

√ n = k

k – número de clases

n - número de observaciones

En nuestro ejemplo se vendieron 80 vehículos entonces n = 80, y hay que encontrar k

√80 = 8.9.

Por lo tanto el número recomendado de clases es 9.

PASO 2. Determinar el intervalo o ancho de clase . El intervalo o ancho de clase debe ser el mismo para todas las clases. Se utilizará la siguiente fórmula.

i ≥ H - L

Donde i es el intervalo de clase, H es el valor observado más alto, L es el valor observado más bajo y k es el número de clases.

k

Page 36: 1. Estadistica Descriptiva VERANO 2014

Para nuestro ejemplo

H = $ 35 925. L = $ 15 546. k = 9

i ≥ ( 35 925 – 15 546) / 9 = $ 2 264.33

En la práctica un intervalo de este tamaño se redondea a cifras convenientes, como múltiplos de 5 o 10 o 100. Por lo tanto podríamos utilizar el valor de $ 2 265.

PASO 3. ESTABLECER LOS LIMITES DE CADA CLASE.

15 546 A 1781115 546 A 17811

17811 A 2007617811 A 20076

20076 A 2234120076 A 22341

22341 A 2460622341 A 24606

24606 A 2687124606 A 26871

26871 A 2913626871 A 29136

29136 A 3140129136 A 31401

31401 A 3366631401 A 33666

33666 A 3593133666 A 35931

Page 37: 1. Estadistica Descriptiva VERANO 2014

PASO 4. Contar el número de elementos de cada clase. El número de observaciones en cada clase se conoce como frecuencia de clase.

Precios de ventaPrecios de venta FRECUENCIAFRECUENCIA

ABSOLUTAABSOLUTA

15 546 A 1781115 546 A 17811

17811 A 2007617811 A 20076

20076 A 2234120076 A 22341

22341 A 2460622341 A 24606

24606 A 2687124606 A 26871

26871 A 2913626871 A 29136

29136 A 3140129136 A 31401

31401 A 3366631401 A 33666

33666 A 3593133666 A 35931

TOTALTOTAL

66

1414

1717

1818

1111

88

22

22

22

8080Distribución de frecuencia de los precios de venta en Whitner Autoplex el mes pasado.

Page 38: 1. Estadistica Descriptiva VERANO 2014

Resumen del patrón en los precios de venta de los vehículos para el lote AutoUSA de Whitner AutoPlex.

1. Los precios de venta van de aproximadamente $15 546 a alrededor de $35 931.

2. Los precios de venta están concentrados entre $20 076 y 24 606. En este rango se vendieron 35 vehículos en total o 43.75%.

3. La mayor concentración o la frecuencia más alta, se encuentra en la clase de $22 341 a $24 606. El punto medio de esta clase es $23 473.50 . Entonces decimos que $23 473.50 es el precio de venta típico.

4. Dos de los vehículos se vendieron en $33 666.00 o más y 6 se vendieron en menos de $17 811.00

Page 39: 1. Estadistica Descriptiva VERANO 2014

Distribución de frecuencias relativasEs conveniente convertir las frecuencias de clase en frecuencias de clase relativas para mostrar la fracción del número total de observaciones o porcentaje en cada clase.

Para convertir una distribución de frecuencia en una distribución de frecuencia relativa, cada una de las frecuencias de clase se divide entre el número total de observaciones.

PRECIOS DE VENTAPRECIOS DE VENTA FRECUENCIAFRECUENCIA

ABSOLUTAABSOLUTA

FRECUENCIAFRECUENCIA

RELATIVARELATIVA

OPERACIONOPERACION

15 546 A 17 811 6 0.075 6/80

17 811 A 20 076 14 0.175 14/80

20 076 A 22 341 17 0.2125 17/80

22 341 A 24 606 18 0.225 18/80

24 606 A 26 871 11 0.1375 11/80

26 871 A 29 136 8 0.100 8/80

29 136 A 31 401

31 401 A 33 666

33 666 A 35 931

2

2

2

0.025

0.025

0.025

2/80

2/80

2/80

TOTAL 80 1.0000 80/80

Page 40: 1. Estadistica Descriptiva VERANO 2014

PRECIOS DE VENTAPRECIOS DE VENTA FRECUENCIAFRECUENCIA

ABSOLUTAABSOLUTA

FRECUENCIAFRECUENCIA

RELATIVARELATIVA

FRECUENCIAFRECUENCIA

ABSOLUTA ACUMULADAABSOLUTA ACUMULADA

15 546 A 17 81115 546 A 17 811 66 0.0750.075 66

17 811 A 20 07617 811 A 20 076 1414 0.1750.175 2020

20 076 A 22 34120 076 A 22 341 1717 0.21250.2125 3737

22 341 A 24 60622 341 A 24 606 1818 0.2250.225 5555

24 606 A 26 87124 606 A 26 871 1111 0.13750.1375 6666

26 871 A 29 13626 871 A 29 136 88 0.1000.100 7474

29 136 A 31 40129 136 A 31 401

31 401 A 33 66631 401 A 33 666

33 666 A 35 93133 666 A 35 931

22

22

22

0.0250.025

0.0250.025

0.0250.025

7676

7878

8080

TOTALTOTAL 8080 1.00001.0000

FRECUENCIAFRECUENCIA

ABSOLUTA ACUMULADAABSOLUTA ACUMULADA

Page 41: 1. Estadistica Descriptiva VERANO 2014

41

PRECIOS DE VENTAPRECIOS DE VENTA FRECUENCIAFRECUENCIA

ABSOLUTAABSOLUTA

FRECUENCIAFRECUENCIA

RELATIVARELATIVA

FRECUENCIAFRECUENCIA

RELATIVA ACUMULADARELATIVA ACUMULADA

15 546 A 17 81115 546 A 17 811 66 0.0750.075 0.0750.075

17 811 A 20 07617 811 A 20 076 1414 0.1750.175 0.2500.250

20 076 A 22 34120 076 A 22 341 1717 0.21250.2125 0.46250.4625

22 341 A 24 60622 341 A 24 606 1818 0.2250.225 0.68750.6875

24 606 A 26 87124 606 A 26 871 1111 0.13750.1375 0.8250.825

26 871 A 29 13626 871 A 29 136 88 0.1000.100 0.9250.925

29 136 A 31 40129 136 A 31 401

31 401 A 33 66631 401 A 33 666

33 666 A 35 93133 666 A 35 931

22

22

22

0.0250.025

0.0250.025

0.0250.025

0.9500.950

0.9750.975

1.0001.000

TOTALTOTAL 8080 1.00001.0000

FRECUENCIAFRECUENCIA

RELATIVA ACUMULADARELATIVA ACUMULADA

Page 42: 1. Estadistica Descriptiva VERANO 2014

Ejercicio 2. Se registran las siguientes mediciones para el tiempo de secado (en horas) de cierta marca de pintura esmaltada.

3.4, 2.5, 4.8, 2.9, 3.62.8, 3.3, 5.6, 3.7, 2.84.4, 4.0, 5.2, 3.0, 4.8

Construya:1. Una tabla de frecuencias agrupando los datos, comenzando la primera

clase en 2.0 y terminando la última en 6.0.2. Incluir en la tabla: las frecuencias relativas, frecuencias absolutas

acumuladas, frecuencias relativas acumuladas.

PROBABILIDAD Y ESTADISTICA. 42

Page 43: 1. Estadistica Descriptiva VERANO 2014

Ejercicio 3. Se le hizo una prueba de hemoglobina a un grupo de pacientes diabéticos, los resultados son

6.5, 5.0, 5.6, 7.6, 4.8, 8.0, 7.5, 7.9, 8.0, 9.26.4, 6.0, 5.6, 6.0, 5.8, 9.2, 8.1, 8.0, 6.5, 6.65.0, 8.0, 6.5, 6.1, 6.4, 6.6, 7.2, 5.9, 4.0, 5.87.9, 6.0, 5.6, 6.0, 6.2, 7.8, 6.8, 7.8, 8.2, 9.0

Construya una tabla de frecuencias agrupando los datos.

PROBABILIDAD Y ESTADISTICA. 43

Page 44: 1. Estadistica Descriptiva VERANO 2014

Ejercicio 4. La siguiente muestra tiene los ingresos ganados cierto sábado por los estudiantes universitarios que trabajan. Las datos están en dólares.

30, 11, 42, 8, 30, 18, 25, 25, 17, 30, 39, 21, 23, 25, 15, 35, 26,13, 21, 26.Si las marcas de clase son 10, 15, 20, 25, 30, 35 y 40, representa los datos en una Tabla de Distribución

de Frecuencias.

Ejercicio 5. La división de servicios alimenticios de Cedar River Amusement Park, Inc. Estudia la cantidad que gastan al día en alimento y bebida las familias que visitan el parque de diversiones. Una muestra de 40 familias que visitó el parque ayer revela que éstas gastan las siguientes cantidades:

$77, 18, 63, 84, 38, 54, 50, 59, 54, 56, 36, 26, 50, 34, 44, 41, 58, 58, 53, 51, 62, 43, 52, 53, 63, 62, 62, 65, 61, 52, 60, 60, 45, 66, 83, 71, 63, 58, 61, 71.

a) Organice los datos en una distribución de frecuencia utilizando 7 clases y el 15 como límite inferior de la primera clase.

b) Describa la distribución.

PROBABILIDAD Y ESTADISTICA. 44

Page 45: 1. Estadistica Descriptiva VERANO 2014

Tipos de variables Tipos de variables

Cualitativas Cuantitativas

• Marca de PC• Estado Civil• Color de cabello

Discretas Continuas

• Hijos en la familia• Golpes en un hoyo de golf• Televisores que tiene

• Cantidad de impuesto sobre el ingreso pagado.• Peso de un estudiante.• Precipitación pluvial anual en Puebla

Page 46: 1. Estadistica Descriptiva VERANO 2014

Representación gráfica.• Datos cuantitativos.Histograma de frecuencias. Gráfica donde el eje horizontal (abscisas)

representa el eje de los datos, clasificados en clases, mientras que el eje vertical (ordenadas) representa la frecuencia de cada clase.

Nota. Es difícil manejar un histograma de frecuencias cuando las clases no tiene la misma longitud.

PROBABILIDAD Y ESTADISTICA. 46

Page 47: 1. Estadistica Descriptiva VERANO 2014

Polígono de frecuencias. Serie de segmentos que unen los puntos cuyas abscisas son las marcas de clase y cuyas ordenadas son las frecuencias asignadas a tal clase.

PROBABILIDAD Y ESTADISTICA. 47

Page 48: 1. Estadistica Descriptiva VERANO 2014

Ojiva de frecuencias. Es una representación gráfica donde el eje horizontal (abscisas) representa los datos y el eje vertical las frecuencias acumuladas. Se ubican los puntos cuyas abscisas son los limites superiores de cada clase y cuyas ordenadas son las frecuencias acumuladas de tal clase.

PROBABILIDAD Y ESTADISTICA. 48

Page 49: 1. Estadistica Descriptiva VERANO 2014

• Datos cualitativos.Gráfica de sectores (pastel o “pie”). Se forma al dividir un círculo en sectores

circulares de manera que: a) Cada sector circular equivale al porcentaje correspondiente al dato o grupo

que representa. b) La unión de los sectores circulares forma el círculo y la suma de sus

porcentajes es 100.

PROBABILIDAD Y ESTADISTICA. 49

Page 50: 1. Estadistica Descriptiva VERANO 2014

Gráfica de barras. Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato.

PROBABILIDAD Y ESTADISTICA. 50

Page 51: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 51

Page 52: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 52

Page 53: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 53

Page 54: 1. Estadistica Descriptiva VERANO 2014

Datos Cualitativos.

Ejercicio. A continuación se muestra la distribución de frecuencias absolutas, relativas y porcentuales de las mascotas mas comunes de los niños, representar los datos en una gráfica de barras y una gráfica de pastel.

Mascota Frecuencia absoluta

Frecuencia relativa

Frecuencia porcentual

Perro 7 0.35 35%Pájaro 4 0.20 20%Hámster 4 0.20 20%Gato 5 0.25 25%

PROBABILIDAD Y ESTADISTICA. 54

Page 55: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 55

Gráfica de barras.

Gráfica de pastel.

Page 56: 1. Estadistica Descriptiva VERANO 2014

Medidas estadísticas.Medidas de centralización (o de tendencia central): Sirven para determinar

los valores centrales o medios de la distribución.

Indican valores alrededor de los cuales los datos parecen agruparse.

Media aritmética.Mediana.Moda.

PROBABILIDAD Y ESTADISTICA. 56

Page 57: 1. Estadistica Descriptiva VERANO 2014

Medidas de dispersión. Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.

Nos dan una idea sobre que tan representativos son las medidas centrales de los datos. A mayor dispersión menor representatividad.

Una dispersión pequeña indica un alto grado de uniformidad en las observaciones y una dispersión grande indica poca uniformidad.

Varianza.Desviación estandar.Coeficiente de variación.Rango.

PROBABILIDAD Y ESTADISTICA. 57

Page 58: 1. Estadistica Descriptiva VERANO 2014

Medidas de posición. Dividen un conjunto ordenado de datos en grupos con la misma cantidad de elementos.

Útiles para una clasificación de los elementos de la muestra.

Cuartiles.Percentiles.

PROBABILIDAD Y ESTADISTICA. 58

Page 59: 1. Estadistica Descriptiva VERANO 2014

Media aritmética. Es el promedio de las mediciones observadas.

Cantidad total de la variable distribuida en partes iguales entre todas las observaciones.

Para datos agrupados mi es la marca de clase, fi es la frecuencia de clase y p es el número total de clases.

59

n

XXXX n

21

n

Xn

ii

1

Datos no agrupados MUESTRA

Datos agrupados

n

fmfmfmX pp

2211

n

fmp

jjj

1

Medidas de centralización

N

XXX N

21N

XN

ii

1

Datos no agrupados POBLACION

Page 60: 1. Estadistica Descriptiva VERANO 2014

Mediana. La mediana de un conjunto de observaciones es el valor que queda en la parte central de un grupo de observaciones arregladas en orden de magnitud.

La mediana deja el mismo número de datos antes y después de ese dato.

PROBABILIDAD Y ESTADISTICA. 60

2

1 ne xm2

1`22

nn

e

xx

m

Datos no agrupados

n parn impar

Datos agrupados

M

Me f

Tn

Lm 21

Page 61: 1. Estadistica Descriptiva VERANO 2014

mediana. la de clase la de ancho el Es

mediana. la de clase la de antesestán que clase de

intervalos losen sfrecuencia las de totalel Es

mediana. la de clase de frecuencia la Es

mediana. la

de clase llamado mediana, la contiene que

clase de intervalo delinferior Límite

T

f

L

M

M

PROBABILIDAD Y ESTADISTICA. 61

Page 62: 1. Estadistica Descriptiva VERANO 2014

Moda: Se define como el valor o clase que tiene la mayor frecuencia en un conjunto de observaciones.

Algunas veces dos clases o categorías tienen un número de observaciones igualmente grande. A esto se le denomina distribución bimodal.

Si tiene una sola moda se llama unimodal.Cuando las mediciones de una variable continua se agrupan como un

histograma de frecuencias o de frecuencias relativas, la clase que tiene la frecuencia más alta se llama clase modal y el punto medio de dicha clase se toma como la moda.

baa

Lm MOo

PROBABILIDAD Y ESTADISTICA. 62

Page 63: 1. Estadistica Descriptiva VERANO 2014

moda. la de clase la de ancho el Es

siguiente. clase la y moda la de clase la entre

frecuencia en diferencia la de absoluto Valor

anterior. clase la y moda la de clase la entre

frecuencia en diferencia la de absoluto Valor

moda. la de clase la de inferior Límite

b

a

LMO

PROBABILIDAD Y ESTADISTICA. 63

Page 64: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 64

LAS POSICIONES RELATIVAS DE LA MEDIA, LA MEDIANA Y LA MODA.

Se llama DISTRIBUCIÓN SIMÉTRICA, a la distribución que tiene la misma forma hacia cualquier lado del centro.

Para una distribución simétrica, en forma de campana, la moda, la mediana y la media se localizan en el centro y siempre son iguales.

Hay distribuciones simétricas que no tienen forma de campana.

Ejemplo Simétrica ( cero sesgo )

Años

Fre

cu

en

cia

Media = 20

Mediana = 20

Moda = 20

Page 65: 1. Estadistica Descriptiva VERANO 2014

Si una distribución es no simétrica o sesgada, cambia la relación entre las tres medidas.

En una distribución con sesgo positivo, la media aritmética es la mayor de las tres medidas, por lo general, la mediana es la medida

siguiente y la moda es la menor de las tres.

Sesgada a la derecha

Ingreso semanal

Fre

cuen

cia

Moda Mediana Media

Page 66: 1. Estadistica Descriptiva VERANO 2014

Si una distribución tiene un sesgo negativo, la media es la menor de las tres medidas, la mediana es mayor que la media aritmética y el valor modal es el mayor.

Sesgada a la izquierda

Fuerza de Tensión

Media Mediana Moda

Page 67: 1. Estadistica Descriptiva VERANO 2014

Varianza: Medida de la desviación de las mediciones muestrales respecto a su media. Es la media del cuadrado de las desviaciones de las

mediciones respecto a su media.

PROBABILIDAD Y ESTADISTICA. 67

1

ˆ 1

2

2

n

XXs

n

ii

Datos no agrupadosMUESTRA

1

ˆ 1

2

2

n

fXm

s

p

jjj

Datos agrupados

n

Xn

ii

1

2

2

Datos no agrupadosPOBLACION

Page 68: 1. Estadistica Descriptiva VERANO 2014

Desviación estándar. También es una medida de la desviación de los datos respecto a la media. Es al raíz cuadrada de la varianza.

PROBABILIDAD Y ESTADISTICA. 68

1

1

2

n

XXs

n

ii

Datos no agrupados MUESTRA

1

1

2

n

fXms

p

jjj

Datos agrupados

N

Xn

ii

1

2

Datos no agrupadosPOBLACION

Page 69: 1. Estadistica Descriptiva VERANO 2014

Rango. Se define como la diferencia entre la medición mayor y la menor.

R = xmáx-xmín

PROBABILIDAD Y ESTADISTICA. 69

Page 70: 1. Estadistica Descriptiva VERANO 2014

EJERCICIO

PROBABILIDAD Y ESTADISTICA. 70

El síndrome de inmunodeficiencia adquirida (SIDA) se ha convertido en una de las enfermedades más devastadoras en la sociedad moderna. Las cantidades de casos de SIDA (en miles) registrados en 25 ciudades principales de los Estados Unidos en 2010 aparecen a continuación:

38.3 6.2 3.7 2.6 2.1

14.6 5.6 3.7 2.3 2.0

11.9 5.5 3.4 2.2 2.0

6.6 4.6 3.1 2.2 1.9

6.3 4.5 2.7 2.1 1.8

Construya los histogramas de frecuencias absoluta y polígono de frecuencias para relativas y las ojivas. Utilice el entero superior de para el número de clases. Además calcule y analice todas las medidas estadísticas correspondientes (media, moda, mediana, varianza, desviación estándar)

Page 71: 1. Estadistica Descriptiva VERANO 2014

Coeficiente de variación

PROBABILIDAD Y ESTADISTICA. 71

En estadística el coeficiente de variación (de Pearson) es una medida de dispersión útil para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media de por tanto un valor positivo.Exigimos que: Se calcula:

Donde σ es la desviación típica. Se puede dar en tanto por ciento calculando:

0 x

VC

100

VC

Page 72: 1. Estadistica Descriptiva VERANO 2014

El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas.

Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

PROBABILIDAD Y ESTADISTICA. 72

Page 73: 1. Estadistica Descriptiva VERANO 2014

Ejemplo.• Una distribución tiene una media de 140 y σ = 28.28 y otra

con media de 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?

PROBABILIDAD Y ESTADISTICA. 73

Page 74: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 74

El Coeficiente de asimetría, se representa mediante la ecuación matemática,

(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).

• (g1 > 0): (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda)

• (g1 < 0): (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)

Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.

31

3

1

)()/1(

s

xxng

n

ii

Page 75: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 75

CURTOSIS

Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).  

Page 76: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 76

  

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se interpretan: (g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil  encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.). (g2 > 0) la distribución es Leptocúrtica (g2 < 0) la distribución es Platicúrtica  Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente.

X

3)()/1(

41

4

2

s

xxng

n

ii

Page 77: 1. Estadistica Descriptiva VERANO 2014

EJEMPLO: Los cálculos para la media aritmética para datos agrupados en una distribución de frecuencias. En la siguiente tabla tenemos una distribución de frecuencias para los precios de venta de los vehículos. Determinar el precio de venta medio aritmético de los vehículos.

Precios de ventaPrecios de venta (miles de $)(miles de $) FRECUENCIA FRECUENCIA

15 A 18 815 A 18 818 A 21 2318 A 21 2321 A 24 1721 A 24 1724 A 27 1824 A 27 1827 A 30 827 A 30 830 A 33 430 A 33 433 A 36 233 A 36 2

TOTALTOTAL 80 80

Page 78: 1. Estadistica Descriptiva VERANO 2014

Precio de venta

(Miles de $)

Frecuencia

( f )

Punto medio

( m )

f m

De 15 hasta 18 8 $16.5 $132.0

De 18 hasta 21 23 19.5 448.5

De 21 hasta 24 17 22.5 382.5

De 24 hasta 27 18 25.5 459.0

De 27 hasta 30 8 28.5 228.0

De 30 hasta 33 4 31.5 126.0

De 33 hasta 36 2 34.5 69.0

Total 80 $1 845.0

Al calcular la media aritmética utilizando la fórmula obtenemos:

De modo que, llegamos a la conclusión de que el precio de venta medio de los vehículos es aproximadamente de $23 100

(miles) $23.1 80

$1845

n

m f X

Page 79: 1. Estadistica Descriptiva VERANO 2014

Precio de venta

(miles $)

Frecuencia

( f )

Punto

Medio

( m )

(m- ) ( m - )²

De 15.0 hasta 18.0

8 16.5 -6.6 43.56 348.48

De 18.0 hasta 21.0

23 19.5 -3.6 12.96 298.08

De 21.0 hasta 24.0

17 22.5 -0.6 0.36 6.12

De 24.0 hasta 27.0

18 25.5 2.4 5.76 103.68

De 27.0 hasta 30.0

8 28.5 5.4 29.16 233.28

De 30.0 hasta 33.0

4 31.5 8.4 70.56 282.24

De 33.0 hasta 36.0

2 34.5 11.4 129.96 259.92

80 1531.80

X X 2 - m f X

Page 80: 1. Estadistica Descriptiva VERANO 2014

Aplicando la fórmula tenemos:

La desviación estándar para datos agrupados es de $ 4 403, que difieren por $49 o 1.1 % ($ 4 354 valor real (toda la población)). Con base en el diferencia porcentual los estimados están muy cerca de los valores reales.

EJERCICIO. Los ingresos netos de una muestra de grandes importadores de antigüedades se organizaron en la siguiente tabla:

4.403

1 - 80

1531.8

1

- m f

2

n

Xs

Ingreso neto

(millones de $)

Número de importadores

De 2 hasta 6 1

De 6 hasta 10 4

De 10 hasta 14 10

De 14 hasta 18 3

De 18 hasta 22 2

a) ¿Cómo se llama la tabla?

b) ¿Cuál es el estimado del ingreso neto medio aritmético?

c) ¿Cuál es el estimado de la desviación media estándar?

Page 81: 1. Estadistica Descriptiva VERANO 2014

TAREA 1. Se realiza un estudio acerca de los efectos del tabaquismo sobre los patrones de sueño. La medición que se observa es el tiempo, en minutos, que toma quedarse dormido. Se obtienen estos datos para una muestra.

Fumadores: 69.3, 56.0, 22.1, 47.6, 53.2, 48.1, 52.7, 34.4, 60.2, 43.8, 23.2, 13.8

No fumadores 28.6, 25.1, 34.9 29.8, 38.5, 30.2 31.8, 41.6, 21.1 36.0, 37.9, 13.9

a) Encuentre la media, la mediana y la desviación estándar para cada grupo. b) Encuentre la media, la mediana y la desviación estándar para datos agrupadosc) Comparar los resultados.

PROBABILIDAD Y ESTADISTICA. 81

Page 82: 1. Estadistica Descriptiva VERANO 2014

La desviación estándar o típica se interpreta utilizando dos medidas:

a) Teorema de Chebyshev o Tchebycheff

b) La Regla Empírica o la regla de la normal

TEOREMA DE CHEBYSHEV.

La desviación típica de un conjunto de observaciones se emplea para medir las variaciones con respecto a la media de los valores de las observaciones. Mientras más pequeña sea la desviación típica, es más probable obtener un valor cercano a la media; mientras mayor sea la desviación típica, es más probable obtener un valor alejado de la media.

El matemático ruso P. L. Chebyshev (1821 – 1894) desarrolló un teorema que nos permite determinar la proporción mínima de los valores que se encuentran en un número específico de desviaciones estándar de la media.

Teorema de Chebyshev. Para cualquier grupo de observaciones (muestra o población), la proporción de los valores que se encuentran dentro de k desviaciones estándar de la media es por lo menos 1 – 1/ k², donde k es cualquier constante mayor que 1.

Page 83: 1. Estadistica Descriptiva VERANO 2014

La proporción de veces que cualquier posible valor de X caerá dentro del intervalo construido es de al menos 1 – 1/k². De acuerdo con esto, la proporción de veces que los valores de X caerán dentro del intervalo formado por dos desviaciones típicas medidas a partir de es 1 – 1/2² = 1 – ¼ = ¾; la proporción de veces que los valores de X caerán dentro de 3

desviaciones típicas medidas a partir de es de al menos 1 – 1/3² = 1 – 1/9 = 8/9.

EJEMPLO: La cantidad media aritmética quincenal con la que contribuyen los empleados de Dupree Paint al plan de participación de utilidades de la compañía fue $51.54 y la desviación estándar es $7.51. ¿Qué porcentaje de las contribuciones se encuentra entre más 3.5 desviaciones estándar y menos 3.5 desviaciones estándar de la media?

SOLUCIÓN.

Alrededor de 92 %.

0.92

25.12

11

5.3

11

11

22

k

X

X

Page 84: 1. Estadistica Descriptiva VERANO 2014

EJEMPLOS:

1. Al menos, ¿qué porcentaje de un conjunto de observaciones caerá

a) Dentro de cinco desviaciones típicas medidas a partir de la media.

b) Dentro de diez desviaciones típicas medidas a partir de la media?

Solución.

a) Al menos 1 – 1/5² = 1 – 0.04 = .96, esto es 96%, de las observaciones caerán dentro de cinco desviaciones típicas medidas a partir de la media.

b) Al menos 1 – 1/10² = 1 – 0.01 = 0.99, esto es 99% de las observaciones caerán dentro de diez desviaciones típicas medidas a partir de la media.

2. A lo más, ¿qué porcentaje de un conjunto de observaciones caerá

a) Más allá de dos desviaciones típicas medidas a partir de la media.

b) Más allá de tres desviaciones típicas medidas a partir de la media?

Las palabras “más allá” se refieren a las partes de la distribución que quedan fuera del intervalo indicado. Entonces, la proporción de la distribución que cae más allá del intervalo es igual a:

1 – proporción dentro del intervalo.

Page 85: 1. Estadistica Descriptiva VERANO 2014

SOLUCIÓN.

a) La proporción de observaciones que cae más allá de 2 desviaciones típicas medidas a partir de la media es 1 – (1 – 1/2²) = 1 – ¾ = ¼

ó 25%.

a) La proporción de la distribución que cae más allá de tres desviaciones típicas medidas a partir de la media es 1 – (1 – 1/3²) = 1 – 8/9 = 1/9 ó 11%.

Page 86: 1. Estadistica Descriptiva VERANO 2014

Teorema de Chebyshev

• El 75%75% de los datos se encuentran a dos desviaciones estándardos desviaciones estándar.

• El 88.89%88.89% de los datos se encuentran a tres desviaciones estándartres desviaciones estándar.

86

Para cualquier distribución de los datos con respecto a la media. La proporción de los datos que se encuentran K desviaciones estándar de la media es al menos:

Por lo cual,

1 - 1k2

1 - 122

1 - 14

3 4

= 75%===

1 - 1k2

1 - 132

1 - 19

8 9

= 88.9%===

1 - 1 - 11kk22

Page 87: 1. Estadistica Descriptiva VERANO 2014

87

x x + 2s x + 3sx - 2sx - 3s

Al menos 75%

Al menos 89%

Page 88: 1. Estadistica Descriptiva VERANO 2014

LA REGLA EMPÍRICA

El Teorema de Chebyshev se ocupa de cualquier grupo de valores, esto es, la distribución de los valores puede tener cualquier forma.

Sin embargo, para una distribución simétrica en forma de campana, podemos ser más precisos al explicar la dispersión en relación con la media.

La REGLA EMPÍRICA, que en ocasiones se conoce como la REGLA de la NORMAL, describe aquellas relaciones que comprenden la desviación estándar y la media.

REGLA EMPÍRICA. Para una distribución de la frecuencia simétrica en forma de campana, aproximadamente 68 % de las observaciones estarán entre más y menos una desviación estándar de la media; alrededor de 95% de las observaciones se encontrarán ente más y menos dos desviaciones estándar de la media y prácticamente todas (99.7%) estarán entre más y menos tres desviaciones estándar de la media.

Page 89: 1. Estadistica Descriptiva VERANO 2014

89

XX X + 1sX + 1s X + 2sX + 2s X + 3sX + 3sX - 3sX - 3s X - 2sX - 2s X -1sX -1s

68%

95%

99.7%

Page 90: 1. Estadistica Descriptiva VERANO 2014

Ejemplo:

Una muestra de las tarifas de renta en los departamentos University Park se asemeja a una distribución simétrica en forma de campana. La media de la muestra es $500; la desviación estándar es $20. Utilizando la Regla empírica, responder las siguientes preguntas:

1. ¿Entre qué par de cantidades se encuentra alrededor de 68 % de los gastos mensuales en alimentos?

2. ¿Entre qué par de cantidades está 95 % de los gastos mensuales en alimentos?

3. ¿Entre qué par de cantidades están casi todos los gastos mensuales?

SOLUCIÓN:

1. Alrededor de 68 % se encuentra entre $480 y $520, calculado como sigue:

2. Aproximadamente 95 % está entre $460 y $540, calculando como sigue:

$201 $500 s 1 X

$202 $500 s 2 X

Page 91: 1. Estadistica Descriptiva VERANO 2014

3. Casi todos (99.7%) se encuentran entre $440 y $560, calculado como sigue:

$203 $500 s 3 X

Page 92: 1. Estadistica Descriptiva VERANO 2014

PROBABILIDAD Y ESTADISTICA. 92

EJERCICIO1. Pitney Pipe Company es uno de varios fabricantes nacionales de tubería PVC. El departamento de control de calidad tomó una muestra de 600 tubos de 10 pies. A la distancia de un pie del extremo del tubo se midió el diámetro exterior; la media fue 14.0 pulgadas y la desviación estándar 0.1 pulgadas.

a) Si la forma de la distribución se desconoce, por lo menos, ¿qué porcentaje de las observaciones estará entre 13.85 pulgadas y 14.15 pulgadas?

b) Si suponemos que la distribución de los diámetros es simétrica y que tiene forma de campana, ¿entre qué par de valores estarán 95% de las observaciones?

EJERCICIO 2. De acuerdo con el teorema de Chebyshev, ¿qué porcentaje de las observaciones debe caer

 Dentro de 2.0 desviaciones estándar?Dentro de 3.5 desviaciones estándar?.Dentro de 5.0 desviaciones estándar?