Estadística aplicada.pdf

143
Estadística aplicada UTVT M.A. Mario González Aguilar [email protected]

Transcript of Estadística aplicada.pdf

Page 1: Estadística aplicada.pdf

Estadística aplicadaUTVT

M.A. Mario González Aguilar

[email protected]

Page 2: Estadística aplicada.pdf
Page 3: Estadística aplicada.pdf

Evaluación

Ejercicios

Tareas

Programación

Examen

Page 4: Estadística aplicada.pdf
Page 5: Estadística aplicada.pdf

Introducción

En la vida cotidiana tenemos contacto con datos estadísticos como los

siguientes:

En 1930 la esperanza de vida de un mexicano era de 34 años, y casi 80 años

después, en el 2009 se calculó en 75 años, más del doble. Este dato nos ayuda

a inferir que el desarrollo socioeconómico, aunado a los avances médicos, nos

pronostica una vida cada vez más larga.

El promedio aritmético de las calificaciones de un estudiante, durante toda su

carrera universitaria es de 9.5 (en escala de 0-10). Esto hace inferir que el

estudiante fue responsable en tareas asignadas y en general fue

comprometido con sus estudios.

Page 6: Estadística aplicada.pdf

Introducción

La vida útil empírica de una computadora es de 4 ±1 año, es decir en

promedio 4 años con una desviación estándar de 1 año. Esta información nos

ayuda a conocer el intervalo de tiempo probable en el que se tendría que

cambiar o renovar una computadora.

Page 7: Estadística aplicada.pdf

Estadística

El término estadística proviene del latín statisticum collegium Estado

(Consejo de Estado) y de su derivado italiano statista (“hombre de política o

político). En 1749, el alemán Gottfried Achenwall comenzó a utilizar la

palabra alemana statistik para designar el análisis de datos estatales.

Las estadísticas (resultado de la aplicación de un algoritmo estadístico a un

grupo de datos) permiten la toma de decisiones dentro del ámbito

gubernamental y hoy en día en el mundo de los negocios. Así la estadística

aplicada puede ser dividida en dos ramas, la estadística descriptiva

(recolección, descripción, visualización y resumen de los datos representados

en forma numérica o gráfica), y la inferencia estadística (la generación de los

modelos y predicciones relacionadas a los fenómenos estudiados, teniendo en

cuenta el aspecto aleatorio y la incertidumbre en las observaciones).

Page 8: Estadística aplicada.pdf

Estadística descriptiva

La estadística descriptiva es la parte de la estadística más accesible, que

consiste en al tratamiento mecánico de un conjunto de datos, que puede ser

representado en tablas o gráficas, es la forma más sencilla de dar información

sobre un todo, por lo que se utiliza en todas las áreas disciplinarias ya sean

sociales, científicas o tecnológicas.

El análisis de datos se hace a través de cálculos de medidas de tendencia

central (media aritmética, media geométrica) y de dispersión (desviación

estándar, varianza), y en su caso representaciones gráficas, para comprender

el significado de estas medidas, es necesario algunas definiciones que se

mencionan a continuación:

Page 9: Estadística aplicada.pdf

Población y muestra

Población: Es el conjunto formado por TODAS las unidades que se están

estudiando.

Muestra: Es un subconjunto, una porción de la población, seleccionada para

su estudio.

Ejemplo.

Población: Estudiantes de la Universidad Tecnológica del Valle de Toluca; es

decir los 2308 estudiantes que actualmente están inscritos.

Muestra: Se eligen al azar 100 estudiantes de la UTVT.

Page 10: Estadística aplicada.pdf

Estadística descriptiva

En la mayoría de los casos prácticos, el estudio de datos se hace sobre una

muestra, por lo que las medidas estadísticas calculadas tienen errores

asociados, es decir no son valores exactos y por ello se denominan variables

estadísticas. Para disminuir el error la selección de la muestra debe ser

aleatoria o sobre una base de probabilidad conocida, además debe ser

representativa de la población, entre más grande la muestra menor será el

error.

La recolección de datos puede ser a través de encuestas, de fuentes

publicadas, de un experimento previamente diseñado y controlado, o de un

estudio observacional. Teniendo los datos de estudio las medidas estadísticas

se pueden obtener del total de datos no ordenados, o bien ordenarlos en

clases. Se describirá el procedimiento de ambos casos, presentando primero

para el caso de datos no ordenados.

Page 11: Estadística aplicada.pdf

Ejercicios media aritmética o promedio

Page 12: Estadística aplicada.pdf

Tarea

Investigar los conceptos:

Estadística

Probabilidad

Conjunto

Media aritmética o promedio

Moda

Mediana

Varianza

Desviación estándar

Page 13: Estadística aplicada.pdf

Media Aritmética

ത𝑋 =𝑥1 + 𝑥2 + ⋯ + 𝑥𝑁

𝑁=

1

𝑁

𝑖=1

𝑁

𝑥𝑖

Page 14: Estadística aplicada.pdf

Media Aritmética

ത𝑋 =𝑥1 + 𝑥2 + ⋯ + 𝑥𝑁

𝑁=

1

𝑁

𝑖=1

𝑁

𝑥𝑖

Ejmplo:

Calcular la media o promedio del siguiente grupo de numeros

12 10 13 11 14 19 15 17 18

ത𝑋 = (12 + 10 + 13 + 11 + 14 + 19 + 15 + 17 + 18) / 9 = 129/9 = 14.333

Page 15: Estadística aplicada.pdf

Mediana

Es el centro de los datos ordenados de manera ascendente o descendente, se

denota como ෨𝑋.

Pasos para su cálculo

a)

Page 16: Estadística aplicada.pdf

Mediana

Page 17: Estadística aplicada.pdf
Page 18: Estadística aplicada.pdf
Page 19: Estadística aplicada.pdf
Page 20: Estadística aplicada.pdf

Moda

Page 21: Estadística aplicada.pdf

Moda

Page 22: Estadística aplicada.pdf

Moda

Page 23: Estadística aplicada.pdf

Varianza y desviación estándar Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

Varianza

la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)

2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).

3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)

Page 24: Estadística aplicada.pdf

Varianza y desviación estándar

Ejemplo

Tú y tus amigos han medido las alturas de sus perros (en milímetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviación estándar.

Page 25: Estadística aplicada.pdf

Varianza y desviación estándar

Respuesta:

así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:

Page 26: Estadística aplicada.pdf

Varianza y desviación estándar

Ahora calculamos la diferencia de cada altura con la media:

Page 27: Estadística aplicada.pdf

Varianza y desviación estándar

𝜎2 =1

𝑁 𝑋𝑖 − 𝑋ത 2𝑖=𝑘

𝑖=1

Page 28: Estadística aplicada.pdf

Varianza y desviación estándar

Page 29: Estadística aplicada.pdf

Varianza y desviación estándar

Así que usando la desviación estándar tenemos una manera "estándar" de saber

qué es normal, o extra grande o extra pequeño.

Los Rottweilers son perros grandes. Y los Dachsunds son un poco más pequeños

*Nota: ¿por qué al cuadrado?

Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para

evitar que los números negativos reduzcan la varianza)

Y también hacen que las diferencias grandes se destaquen. Por ejemplo

1002=10,000 es mucho más grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo

deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.

Page 30: Estadística aplicada.pdf

Ejercicios

Obtener media, varianza y desviación estándar

2, 3, 6, 8, 11.

12, 6, 7, 3, 15, 10, 18, 5.

2, 3, 6, 8, 11, 10, 12, 14

3, 6, 9, 12, 15, 18, 21, 24, 27, 30

Page 31: Estadística aplicada.pdf

Media de distribución de frecuencias

Page 32: Estadística aplicada.pdf

Media de distribución de frecuencias

La marca clase de una tabla para datos agrupados en

intervalos corresponde al promedio de los extremos de

cada intervalo.

Page 33: Estadística aplicada.pdf

Media de distribución de frecuencias

Page 34: Estadística aplicada.pdf

Ejercicio

Page 35: Estadística aplicada.pdf

Solución

Page 36: Estadística aplicada.pdf

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2

Luego calculamos según la siguiente fórmula:

Page 37: Estadística aplicada.pdf

Mediana

Page 38: Estadística aplicada.pdf

Ejercicio Mediana

Page 39: Estadística aplicada.pdf

Solución

Page 40: Estadística aplicada.pdf

Moda para datos agrupados

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias

con datos agrupados, hablaremos de intervalo modal.

La moda se representa por Mo.

Page 41: Estadística aplicada.pdf

Ejercicio

Page 42: Estadística aplicada.pdf

Moda para datos agrupados

Page 43: Estadística aplicada.pdf

Ejercicio, media, moda, mediana

i LI LS Frecuencia absolutaMarca

de clase

Frecuencia

acumulada

1 1 60 18 30.5 18

2 61 120 15 90.5 33

3 121 180 23 150.5 56

4 181 240 21 210.5 77

5 241 300 18 270.5 95

6 301 360 21 330.5 116

7 361 420 21 390.5 137

8 421 480 13 450.5 150

Total 150

Page 44: Estadística aplicada.pdf

Ejercicio, media, moda, medianai LI LS Frecuencia

Marca

de clase

Frecuencia

acumulada

1 1 50 14

2 51 100 17

3 101 150 28

4 151 200 25

5 201 250 11

6 251 300 29

7 301 350 20

8 351 400 14

Total

Page 45: Estadística aplicada.pdf

Probabilidad

La probabilidad es la medida de la posibilidad de que ocurra un resultado específico, llamado evento (E), que se encuentra entre todos los posibles resultados de un experimento, conjunto al que se le nombra espacio muestral.

Los siguientes conceptos son esenciales en la probabilidad:

Experimento: Cualquier procedimiento o actividad del que se pueden obtener diversos resultados. Ejemplo: lanzar una moneda, tomar sin ver un número de una tómbola, elegir una carta de una baraja, elegir un procesador, medir el voltaje.

Evento: Resultado o grupo de resultados posibles de un experimento. Ejemplos respectivos a los experimentos descritos arriba: cae sol, se obtiene un número primo, se elige un haz, el procesador es defectuoso, 110.2 V.

La probabilidad de un evento P(E) se obtiene con el cociente del número de resultados que hacen posible el evento (h), y el número total de posibles resultados (n). Es decir

𝑃 𝐸 =ℎ

𝑛

Page 46: Estadística aplicada.pdf

Probabilidad

Ejemplo:

Experimento: Se lanza un dado

Evento (E): Cae un número par

Resultados que hacen posible el evento: {2, 4, 6}, es decir tres resultados hacen cierto el evento

Resultados posibles: {1, 2, 3, 4, 5,6}, son seis resultados posibles

Por lo que 𝑃 𝐸 =3

6= 0.5, o bien 50% de probabilidad de que caiga par.

Es evidente que para calcular probabilidades es necesario conocer la cantidad de posibles resultados para lo cual son valiosas las técnicas de conteo, como permutaciones, combinaciones y diagramas de árbol. Por lo que repasaremos estos conceptos.

Page 47: Estadística aplicada.pdf

Permutaciones y combinaciones

Page 48: Estadística aplicada.pdf

Permutaciones

El número de permutaciones posibles de n elementos se calcula como n!

Ejemplo: si para diseñar una bandera con tres franjas verticales de distinto color,

se cuenta con tres lienzos uno verde, uno blanco y uno rojo, ¿Cuántos diseños

diferentes son posibles?

En el ejemplo anterior el número de permutaciones es 3! = 3x2x1 = 6

Page 49: Estadística aplicada.pdf

Permutaciones

Usando Factoriales

Cuando escogemos k de n objetos y no se permite repeticiones, podemos usar la

siguiente fórmula :

Page 50: Estadística aplicada.pdf

Permutaciones

Cuando escogemos r de n objetos y se permite repeticiones, podemos usar la

siguiente fórmula :

Page 51: Estadística aplicada.pdf

Ejemplos permutaciones

Si tuviéramos un lienzo verde, un blanco, un rojo y un azul, y queremos una bandera

incluyendo solo tres colores, ¿cuántas banderas podemos hacer?

Page 52: Estadística aplicada.pdf

Ejercicio permutaciones

Ejemplo: si tuviéramos un lienzo verde, un blanco, un rojo y un azul, y queremos una

bandera incluyendo solo tres colores, ¿cuántas banderas podemos hacer?

Page 53: Estadística aplicada.pdf

Ejemplos permutaciones

Page 54: Estadística aplicada.pdf

Combinaciones

Usando Factoriales

Cuando escogemos k de n objetos, podemos usar la siguiente fórmula:

Page 55: Estadística aplicada.pdf

Combinaciones

Ejemplo: Una organización de una escuela tiene 30 miembros. Cuatro

miembros serán escogidos al azar para una entrevista con el periódico de

la escuela sobre el grupo. ¿Cuántos grupos de 4 personas son posibles?

Page 56: Estadística aplicada.pdf

Ejercicio

Ejemplo: De 5 estudiantes (Gaby, Dany,

Jorge, Arturo y Marco) se desea elegir un

comité de tres, ¿Cuáles son las posibles

combinaciones?

Page 57: Estadística aplicada.pdf

Ejercicio

Page 58: Estadística aplicada.pdf

Ejercicio

Para una prueba psicológica se dejan frente al

postulante dos recipientes: uno con 6 colores

claros distintos y el otro con 6 colores obscuros

distintos. La indicación es que realice un dibujo

usando 3 colores claros y 2 obscuros. ¿Cuántos

conjuntos distintos pueden elegirse?

Page 59: Estadística aplicada.pdf

Ejercicio

Solución.

El número de formas de elegir 3 colores claros de

un total de 6, es 6C3=20. El número de formas de

elegir 2 colores obscuros de 6 disponibles, es

6C2=15. Como cada tres colores claros puede

unirse con cualquiera de las parejas de colores

obscuros, el número total de conjuntos de 5

colores usados son: 20 x 15 = 300.

Page 60: Estadística aplicada.pdf

Diagrama de árbol

El diagrama de árbol es otra técnica de conteo, donde se visualiza el espacio

muestral de un experimento.

Ejemplo:

Un fabricante de Notebooks puede equiparlas con accesorios opcionales:

cubierta (negra, roja o azul), material de cubierta (dos tipos, plástico o

laminado), con ratón (de tres tipos). Si el espacio muestral consta de todos

los tipos de laptop ¿Cuál es el número de resultados en el espacio muestral?

Solución:

Utilizando un diagrama de árbol se obtiene

Page 61: Estadística aplicada.pdf

Diagrama de árbol

Page 62: Estadística aplicada.pdf

Diagrama de árbol

Ejercicio: elaborar el diagrama de árbol para los posibles atuendos con una

playera(roja, negra), Zapatos(botas, tenis), pantalón(vestir, mezclilla) y

chamarra(térmica, rompe vientos)

Page 63: Estadística aplicada.pdf

Diagrama de árbol

Ejercicio: Elaborar el diagrama de árbol las posibles rutas de embarque de

computadoras, aerolínea(Volaris, Interjet, Aeromexico, United Airlines, Delta,

American Airlines) si cada aerolínea tiene 3 posibles rutas

Page 64: Estadística aplicada.pdf

Probabilidad con árboles de decisión

Page 65: Estadística aplicada.pdf

Ejercicio

Una clase consta de seis niñas y 10 niños. Si se escoge un comité de tres al

azar, hallar la probabilidad de:

1. Seleccionar tres niños.

2. Seleccionar exactamente dos niños y una niña.

3. Seleccionar exactamente dos niñas y un niño.

4. Seleccionar tres niñas

Page 66: Estadística aplicada.pdf

Ejercicio

Page 67: Estadística aplicada.pdf

Ejercicio

Page 68: Estadística aplicada.pdf

Ejercicio

Page 69: Estadística aplicada.pdf

Teoría de conjuntos

Page 70: Estadística aplicada.pdf

Teoría de conjuntos

U

U

Page 71: Estadística aplicada.pdf

Teoría de conjuntos: intersección

Page 72: Estadística aplicada.pdf

Teoría de conjuntos: intersección

Page 73: Estadística aplicada.pdf

Teoría de conjuntos: diferencia de sucesos

Page 74: Estadística aplicada.pdf

Ejemplo

Obtenga:

1. A U B

2. A ∩ B

3. A - B

Page 75: Estadística aplicada.pdf

Ejemplo

Obtenga:

1. A U B

2. A ∩ B

3. A - B

Page 76: Estadística aplicada.pdf

Teoría de conjuntos

Page 77: Estadística aplicada.pdf

Teoría de conjuntos

Page 78: Estadística aplicada.pdf

Teoría de conjuntos

U U U U

U U

U U

∩ ∩ ∩ ∩

∩ ∩

∩∩

Page 79: Estadística aplicada.pdf

Propiedades conjuntasDistributiva: A ∩ (B U C) = (A ∩ B) U(A ∩ C)

Ejercicio:

Page 80: Estadística aplicada.pdf

Propiedades conjuntas

U

U ∩ U

∩ ∩

Distributiva: A ∩ (B U C) = (A ∩ B) U(A ∩ C)

Page 81: Estadística aplicada.pdf

Probabilidad

La probabilidad de sucesos incompatibles:

P(A1 U A2 U A3…U An ) = P(A1) + P(A2)+ P(A3) … P(An)

La probabilidad del Espacio muestral:

P(E) = 1

Page 82: Estadística aplicada.pdf

Probabilidad condicional

Sean A y B dos sucesos de un mismo espacio muestral E.Se llama probabilidad del suceso B condicionado a A y se representa por P(B/A) a la probabilidad del suceso B una vez ha ocurrido el A.

Page 83: Estadística aplicada.pdf

Probabilidad condicional

Page 84: Estadística aplicada.pdf

Probabilidad condicional

Page 85: Estadística aplicada.pdf

Probabilidad condicional

Page 86: Estadística aplicada.pdf

Probabilidad condicional

Sucesos independientes Dos sucesos A y B son independientes si

p(A/B) = p(A)

Sucesos dependientes Dos sucesos A y B son dependientes si

p(A/B) ≠ p(A)

Page 87: Estadística aplicada.pdf

Teorema de Bayes

Page 88: Estadística aplicada.pdf

Teorema de Bayes

Page 89: Estadística aplicada.pdf

Teorema de Bayes

Page 90: Estadística aplicada.pdf

Teoremas de Bayes

Page 91: Estadística aplicada.pdf

Distribución binomial

Page 92: Estadística aplicada.pdf

Distribución binomial

Page 93: Estadística aplicada.pdf

Distribución binomial

Page 94: Estadística aplicada.pdf

Distribución binomial

Page 95: Estadística aplicada.pdf

Media y Varianza de la Distribución

binomial

Ejemplo:La probabilidad de que un artículo producido por una fabrica sea defectuoso es 0.02. Se envió un cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de artículos defectuosos, la varianza y la desviación típica.

Page 96: Estadística aplicada.pdf

Distribución binomial

Page 97: Estadística aplicada.pdf

Distribución binomial

Page 98: Estadística aplicada.pdf

Distribución binomial

Page 99: Estadística aplicada.pdf

Distribución binomial

Page 100: Estadística aplicada.pdf

Distribución binomial

Page 101: Estadística aplicada.pdf

Distribución binomial

Page 102: Estadística aplicada.pdf

Distribución hipergeométrica

Son experimentos donde, al igual que en la distribución binomial, en cada

ensayo hay tan sólo dos posibles resultados: o sale blanca o no sale. Pero se

diferencia de la distribución binomial en que los distintos ensayos son

dependientes entre sí:

Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una

bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las

probabilidades son diferentes (hay dependencia entre los distintos ensayos).

Page 103: Estadística aplicada.pdf

Distribución hipergeométrica

Page 104: Estadística aplicada.pdf

N2: Número de elementos que no tiene la característica o propiedad específica

(fracasos)

Page 105: Estadística aplicada.pdf

Distribución hipergeométrica

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%.

Page 106: Estadística aplicada.pdf
Page 107: Estadística aplicada.pdf

Ejercicios

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son

defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean

defectuosos?

Solución:

N = 10 objetos en total

N1 = 3 objetos defectuosos

N2 = 7 objetos no defectuosos

n = 4 objetos seleccionados en muestra

k = 2 objetos defectuosos deseados en la muestra

Page 108: Estadística aplicada.pdf

Ejercicios

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos alazar, ¿cuál es la probabilidad de que 2 sean defectuosos?

Solución:

N = 10 objetos en totalN1 = 3 objetos defectuososN2 = 7 objetos no defectuososn = 4 objetos seleccionados en muestrak = 2 objetos defectuosos deseados en la muestra

0.30

Page 109: Estadística aplicada.pdf

Ejercicio

Ejemplos:1.Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en

apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión

de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?.

Solución:

a) N = 9+6 =15 total de tabletas

N1 = 6 tabletas de narcótico

N2 = 3 píldoras de vitaminas

n = 3 tabletas seleccionadas

x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede

encontrar al seleccionar las 3 tabletas

p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más

tabletas de narcótico)

Page 110: Estadística aplicada.pdf

Ejercicio

Ejemplos:1.Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que

son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el

viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?.

Solución:

a) N = 9+6 =15 total de tabletas

N1 = 6 tabletas de narcótico

N2 = 3 píldoras de vitaminas

n = 3 tabletas seleccionadas

x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas

p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico)

0.815338 1- 0.184615

Page 111: Estadística aplicada.pdf

Distribución de Poisson Recibe su nombre en honor de Simeon Poisson, quien fue el que la estudió y

dio a conocer en 1837. También se conoce como la Ley de eventos

improbables, debido a que la probabilidad de éxito P es bastante pequeña y

es una distribución de probabilidad discreta.

Así mismo la distribución de Poisson se puede utilizar para determinar la

probabilidad de un número designado de éxitos como son:

a) Número de clientes que son atendidos en una ventanilla de banco.

b) Número de accidentes en una carretera.

c) Número de llamadas en un determinado tiempo

d) Número de partes defectuosas, etc

Page 112: Estadística aplicada.pdf

Distribución de Poisson

Page 113: Estadística aplicada.pdf

Distribución de Poisson

En la ventanilla de un banco, en promedio se atienden a 20 personas por hora,

¿cuál es la probabilidad de que en una hora se atiendan a 7 personas?

µ = 20

e = 2.7183

K=7

P(x=k) = (20)7 (2.7183) -20

_________________ = 0.00052

7!

Page 114: Estadística aplicada.pdf

Ejercicios:

En un aeropuerto, llegan en promedio 10 aviones por hora, ¿cuál es la

probabilidad de que lleguen menos de 3 aviones en una hora?

P(x< 3) = P(x = 0) + P(x = 1) + P(x = 2)

µ = 10

e = 2.7183

K=0,1,2

Page 115: Estadística aplicada.pdf

Ejercicios:

En una gasolinera, una bomba surte a 90 autos por hora. ¿Cuál es la

probabilidad de que en 15 minutos se surtan exactamente 8 automóviles.

µ = 90 X hora, hacer regla de 3 y obtener el promedio para 15 minutos

e = 2.7183

K = 8

Page 116: Estadística aplicada.pdf

Ejercicios:

Cada rollo de acero de 800 metros tienen en promedio 5 imperfecciones,

¿Cuál es la probabilidad de que en 200 metros no exista ninguna

imperfección?

µ = 5 X 800 metros, hacer regla de 3 y obtener el promedio para 200 metros

e = 2.7183

K = 0

Page 117: Estadística aplicada.pdf

Ejercicios Distribución de Poisson

Un cajero automático es utilizado cada 20 minutos por 6 personas en

promedio. Se desea saber cuál es la probabilidad de:

a) Que el cajero sea utilizado por 5 personas en 20 minutos.

b) Que el cajero sea utilizado por 10 personas en 20 minutos.

c) Que el cajero sea utilizado por 5 personas o menos en 20 minutos.

Si un banco recibe en promedio 6 cheques sin fondo por día. Cuáles son las

probabilidades de que:

a) Reciba 4 cheques sin fondo en un día.

b) 10 cheques sin fondo en cualquiera de 2 días consecutivos.

Page 118: Estadística aplicada.pdf

Distribución Geométrica

Si una variable aleatoria discreta X definida en un espacio de probabilidad representa el numero de repeticiones necesarias de un experimento de Bernoulli para obtener el primer éxito, entonces tiene por función de densidad: X-1

P(x=k) = qk-1 . p P (X=k) = función de densidad, de la variable aleatoria con distribución geométrica.

k Numero de experimentos hasta que aparece el 1er éxito.

p probabilidad de éxito

q probabilidad de fracaso (1 - p)

Page 119: Estadística aplicada.pdf

Distribución Geométrica

Del salon el 60% de los alumnos son hombres, calcular probabilidad

de extraer el 1er hombre a la cuarta ocasión que extraemos un

alumno.

Definir éxito: sea hombre.

k = 4

p = 0.60

q = 0.40

P(x=k) = qk-1 . p

Page 120: Estadística aplicada.pdf

Distribución Geométrica

Ejemplo:2 Calcular la

probabilidad de que salga

el No. 5 a la tercera vez

que lanzamos un dado.

Page 121: Estadística aplicada.pdf

Distribución Geométrica Ejemplo:2 Calcular la probabilidad de que salga el No. 5 a la tercera vez que

lanzamos un dado.

Definir éxito: sale No. 5

k = 3

p = 1/6 = 0. 1666

q = (1 - 0.16660) = 0.8333

P(X=3) = (0.8333)3-1(0.1666) = (0.8333)2(0.1666) =0.1156

Page 122: Estadística aplicada.pdf

Distribución Geométrica

En el salón hay 8 alumnos de ojos cafés, 9 de ojos azules, 7 de ojos negros, y 10 de ojos verdes; si extraemos 6 alumnos,

Calcular la probabilidad de que este ultimo tenga los ojos claros.

Calcular la probabilidad de que este ultimo no tenga los ojos claros.

Calcular la probabilidad de que este ultimo tenga los ojos NEGROS.

Calcular la probabilidad de que este ultimo tenga los ojos CAFES.

Page 123: Estadística aplicada.pdf

Distribución Geométrica

En el salón hay 8 alumnos de ojos cafés, 9 de ojos azules, 7 de ojos negros, y 10

de ojos verdes; si extraemos 6 alumnos, calcular la probabilidad de que este

ultimo tenga los ojos claros.

Definir éxito: tenga ojos claros.

k = 6

p = 0.5588

q = 1- 0.5588 = 0.4412

P(X=6) = (0.4412)6-1(0.5588) = (0.4412)5(0.5588) = 0.0093

Page 124: Estadística aplicada.pdf

Distribución Geométrica

Una máquina detecta fallas en los productos que elabora una fabrica. Si losproductos tienen una probabilidad de falla del 5%.

calcular la probabilidad de que la máquina encuentre su primer productodefectuoso en la octava ocasión que selecciona un producto para su inspección.

Calcular la probabilidad de que la máquina encuentre su primer productodefectuoso en la decima ocasión que selecciona un producto para su inspección.

Calcular la probabilidad de que la maquina encuentre su primer productodefectuoso en la novena ocasión que selecciona un producto para su inspección.

Calcular la probabilidad de que la maquina encuentre su primer producto NOdefectuoso en la novena ocasión que selecciona un producto para su inspección.

Calcular la probabilidad de que la maquina encuentre su primer producto NOdefectuoso en la DECIMA ocasión que selecciona un producto para su inspección.

Page 125: Estadística aplicada.pdf

Distribución Geométrica

Una maquina detecta fallas en los productos que elabora unafabrica. Si los productos tienen una probabilidad de falla del 5%,calcular la probabilidad de que la maquina encuentre su primerproducto defectuoso en la octava ocasión que selecciona unproducto para su inspección.

Definir éxito: salga defectuoso el producto.

k = 8

p = 0.05

q = 1 - 0.05 = 0.95

P(X=8) = (0.95)8-1(0.05) = (0.95)7(0.05) =0.0349

Page 126: Estadística aplicada.pdf

La distribución uniforme continua La distribución uniforme es aquella que puede tomar cualquier valor dentro de un

intervalo, todos ellos con la misma probabilidad.

Es una distribución continua porque puede tomar cualquier valor y no únicamente un número determinado (como ocurre en las distribuciones discretas).

Ejemplo: el precio medio del kilo de salmón durante el próximo año se estima que puede oscilar entre 140 y 160 pesos. Podría ser, por tanto, de 143 pesos, o de 143.4 pesos., o de 143.45 pesos, o de 143.455 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

Page 127: Estadística aplicada.pdf

La distribución uniforme continua

Donde:

b: es el extremo superior (en el ejemplo, 160 pesos)

a: es el extremo inferior (en el ejemplo, 140 pesos)

Por lo tanto, la función de distribución del ejemplo sería:

Es decir, que el valor final esté entre 140 pesos y 141 pesos tiene un 5% de probabilidad, que esté entre 141 y 142, otro 5%, etc.

Page 128: Estadística aplicada.pdf

La distribución uniforme continua

Por lo tanto, el precio promedio esperado del salmón para el próximo año es de 150 pesos

Page 129: Estadística aplicada.pdf

La distribución uniforme continua

Es decir, la precipitación media estimada en Toluca para el próximo año es de

450 litros.

El volumen de precipitaciones estimado para el próximo año en la ciudad de Toluca va a oscilar entre 400 y 500 litros por metro cuadrado. Calcular la función de distribución y la precipitación media esperada:

Page 130: Estadística aplicada.pdf

Distribución Normal

Definición de distribución normal

Una variable aleatoria X con función de densidad de probabilidad

𝑃 𝑥 =1

2𝜋𝜎𝑒

− 𝑥−𝜇 2

2𝜎2 , −∞ < 𝑥 < ∞

Tiene una distribución normal, con parámetro µ, donde −∞ < 𝜇 < ∞, 𝑦 𝜎 > 0.

Para encontrar la probabilidad de que la variable aleatoria este en cierto intervalo

sería necesario calcular la integral definida correspondiente, lo cual no es práctico,

de manera que lo que se hace en la práctica es tomar la variable aleatoria normal,

estandarizarla con el cambio de variable 𝑍 =𝑋−𝜇

𝜎,y obtener el área correspondiente,

es decir la probabilidad, en la tabla de distribución normal estándar, que tiene media

cero y desviación estándar 1

Page 131: Estadística aplicada.pdf

Distribución Normal

Page 132: Estadística aplicada.pdf

Distribución Normal

Page 133: Estadística aplicada.pdf

Ejemplos

Tenemos un programa de entrenamiento diseñado para mejorar la calidad de

las habilidades de los supervisores de línea de producción. Debido a que el

programa es autoadministrado, los supervisores requieren un número

diferente de horas para terminarlo. Un estudio de los participantes anteriores

indica que el tiempo medio para completar el programa es de 500 horas, y

que esta variable aleatoria normalmente distribuida tiene una desviación

estándar de 100 horas.

Ejemplo 1 ¿Cuál es la probabilidad de que un participante elegido al azar

requiera más de 500 horas para completar el programa?

Page 134: Estadística aplicada.pdf

Ejemplos

Tenemos un programa de entrenamiento diseñado para mejorar la calidad de las

habilidades de los supervisores de línea de producción. Debido a que el programa

es autoadministrado, los supervisores requieren un número diferente de horas

para terminarlo. Un estudio de los participantes anteriores indica que el tiempo

medio para completar el programa es de 500 horas, y que esta variable aleatoria

normalmente distribuida tiene una desviación estándar de 100 horas.

Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y

650 horas para completar el programa de entrenamiento?

Si buscamos z 1.5 en la tabla 1 del apéndice, encontraremos una probabilidad de 0.4332.

En consecuencia,

la probabilidad de que un candidato escogido al azar requiera entre 500 y 650 horas para

terminar el programa de entrenamiento es ligeramente mayor a 0.4.

Page 135: Estadística aplicada.pdf

Ejemplos

¿Cuál es la probabilidad de que un

candidato elegido al azar se tome

más de 700 horas

Page 136: Estadística aplicada.pdf

Ejemplos ¿Cuál es la probabilidad de que un candidato elegido al azar se tome más de 700

horas

Buscando en la tabla 1 del apéndice un valor de z igual a 2.0, encontramos una probabilidad de 0.4772. Esto

representa la probabilidad de que el programa tome entre 500 y 700 horas. Sin embargo, deseamos tener la

probabilidad de que tome más de 700 horas (el sombreado de la figura). Puesto que la mitad derecha de la curva

(entre la media y la cola derecha) representa una probabilidad de 0.5, podemos obtener nuestra respuesta (el

área que se encuentra a la derecha del punto correspondiente a 700 horas) si restamos 0.4772 de 0.5;

0.5000 - 0.4772 = 0.0228.

Por tanto, hay un poco más de dos oportunidades en 100 de que un participante elegido al azar se lleve más de

700 horas en completar el curso.

Page 137: Estadística aplicada.pdf

Ejemplos

Suponga que el director del programa de

entrenamiento desea saber la probabilidad de que

un participante escogido al azar requiera entre 550

y 650 horas para completar el trabajo requerido en

el programa.

Page 138: Estadística aplicada.pdf

Ejemplos Suponga que el director del

programa de entrenamiento desea

saber la probabilidad de que un

participante escogido al azar

requiera entre 550 y 650 horas para

completar el trabajo requerido en el

programa.

Esta probabilidad está representada

por el área sombreada de la figura 5-

19. En esta ocasión, nuestra

respuesta requerirá nuevos pasos.

Primero calculamos un valor de z

para nuestro punto correspondiente

a 650 horas de la siguiente manera:

Cuando buscamos un valor de z

igual a 1.5 en la tabla 1 del

apéndice, encontramos una

probabilidad de 0.4332 (la

probabilidad de que la variable

aleatoria esté entre la media y 650

horas). Ahora, para el segundo paso

calculamos un valor de z para el

punto correspondiente a 550 horas,

así:En la tabla 1 del apéndice, nos damos cuenta de

que el valor z igual a 0.5 tiene una probabilidad

de 0.1915 (la posibilidad de que la variable

aleatoria caiga entre la media y 550 horas). Para

responder nuestra pregunta, debemos realizar la

resta siguiente:

Page 139: Estadística aplicada.pdf

Ejercicio

¿Cuál es la probabilidad de que un

candidato elegido al azar se tomará

menos de 580 horas para completar el

programa?

Page 140: Estadística aplicada.pdf

Ejercicio ¿Cuál es la probabilidad de que un candidato elegido al azar se tomará menos

de 580 horas para completar el programa?

Al buscar en la tabla 1 del apéndice un valor para z igual a 0.8, encontramos una probabilidad de 0.2881 (la probabilidad de que la variable aleatoria

esté entre la media y 580 horas). Debemos sumar a ésta la probabilidad de que la variable aleatoria esté entre la cola izquierda y la media. Debido a

que la distribución es simétrica con respecto a la mitad de su área a cada lado de la media, sabemos que este valor debe ser de 0.5. Como paso final,

entonces, sumamos las dos probabilidades:

Page 141: Estadística aplicada.pdf

Ejercicio

¿Cuál es la probabilidad de que un

candidato escogido al azar se tome

entre 420 y 570 horas para completar

el programa?

Page 142: Estadística aplicada.pdf

Ejercicio

¿Cuál es la probabilidad de que un candidato escogido al azar se tome entre 420 y 570 horas para

completar el programa?

La figura ilustra el intervalo en cuestión de 420 a 570 horas. De nuevo, para llegar a la solución se

necesitan dos pasos. Primero, calculamos un valor para z correspondiente al punto 570 horas:

Buscamos el valor de z correspondiente a 0.7 en la tabla 1 del

apéndice y encontramos 0.2580 como

valor de probabilidad. Segundo, calculamos el valor de z para el

punto correspondiente a 420 horas:

Como la distribución es simétrica, podemos desentendernos del signo y buscar un

valor de z correspondiente a 0.8. La probabilidad asociada con este valor de z es

0.2881. Encontramos nuestra respuesta si sumamos estos dos valores, para

obtener:

Page 143: Estadística aplicada.pdf