Clase de introducción a la estadística

38
1 de 44 Fundamentos de Teoría Estadística

Transcript of Clase de introducción a la estadística

Page 1: Clase de introducción a la estadística

1 de 44

Fundamentos de Teoría Estadística

Page 2: Clase de introducción a la estadística

2 de 44

Temas a tratar

Indicadores.

Datos.

Variación y tipo de causas.

Distribuciones, y cálculo de parámetros y estadísticos.

Caracterización de los datos.

Sumando o restando distribuciones.

Relación entre estadísticos y parámetros.

Intervalos de Confianza.

Ejercicios.

Page 3: Clase de introducción a la estadística

Indicadores

Page 4: Clase de introducción a la estadística

4 de 44

Características de un indicador

Todo indicador, no importa de qué tipo sea, debe cumplir con las siguientes características:

Mesurable

Existe una manera de cuantificar el cumplimiento de la especificación.

Verificable

Múltiples observadores deberían coincidir cuando evalúan el resultado del indicador.

Eficiente

Deben ser elegidos considerando el costo.

Page 5: Clase de introducción a la estadística

DMAIC - Fase 1 Medir

Datos

Page 6: Clase de introducción a la estadística

6 de 44

Para qué recolectamos datos

Para separar lo que “pensamos que pasa” de lo que “realmente pasa”.

Confirmar o descartar ideas y preconceptos.

Establecer una línea de base para el desempeño.

Ver el desempeño del proceso o la historia de un problema a lo largo del tiempo.

Medir el impacto de los cambios introducidos.

Identificar y entender las relaciones que explican la variación.

Controlar un proceso.

Evitar soluciones que no corrigen realmente el problema.

Page 7: Clase de introducción a la estadística

7 de 44

Variables para las cuales recolectar datos

Los datos pueden pertenecer a:

Y: Resultado del proceso medido en el producto o servicio, que se entrega al cliente externo del proceso.

y: Resultado intermedio del proceso medido en el producto o servicio que un cliente interno recibe de un proveedor interno.

x: Variable de proceso que afecta al y o al Y.

X: Variable medida en el producto o servicio que es input del proceso.

Page 8: Clase de introducción a la estadística

11 de 44

Definiciones operacionales 1

Para que un dato pueda ser confiable debe, entre otros factores, tener una definición operacional.

Una Definición Operacional se refiere a: Una clara, compresible y no ambigua descripción de qué

debe ser medido u observado... De manera tal que todos puedan operar o medir

consistentemente en base a la definición.

¿Cómo describir mejor el factor / cosa que queremos observar y medir?

Page 9: Clase de introducción a la estadística

12 de 44

Definiciones operacionales 2

No hay una regla ni respuesta única para lograr una definición operacional de una medición.

Lo más específico posible, es mejor.

La mejor manera de mejorar una definición operacional es poniéndola a prueba con quienes la usarán en la práctica. El entrenamiento y uso monitoreado es indispensable.

Page 10: Clase de introducción a la estadística

DMAIC - Fase 1 Medir

Variación y tipo de causas

Page 11: Clase de introducción a la estadística

14 de 44

Variación 1

Los resultados y variables de un proceso están afectados por variación.

Medio ambiente

Personas

Máquinas

MaterialesMétodosMediciones

Los resultados del proceso tienen variación, lo que

afecta al cliente

Los resultados del proceso tienen variación, lo que

afecta al cliente

La variación está originada en la variación de las

variables

La variación está originada en la variación de las

variables

Una importante fuente de variación está en la omisión

de métodos estudiados y comunes a todos los

operadores.

Una importante fuente de variación está en la omisión

de métodos estudiados y comunes a todos los

operadores.

A mayor uniformidad de las variables, mayor

uniformidad del resultado

A mayor uniformidad de las variables, mayor

uniformidad del resultado

Page 12: Clase de introducción a la estadística

15 de 44

Variación 2

Máquinas

MaterialesMétodosMediciones

Medio ambiente

Personas

Tiempo

Med

ició

n

Page 13: Clase de introducción a la estadística

16 de 44

Variación 3

Verifiquemos la existencia y tipos de variación.

Si tiramos dos dados, y sumamos los resultados de ambos:

¿Cuáles serán los posibles resultados de nuestra suma?

¿Cuál es la probabilidad de cada valor?

6-66-56-46-36-26-1

5-65-55-45-35-25-1

4-64-54-44-34-24-1

3-63-53-43-33-23-1

2-62-52-42-32-22-1

1-61-51-41-31-21-1

6-66-56-46-36-26-1

5-65-55-45-35-25-1

4-64-54-44-34-24-1

3-63-53-43-33-23-1

2-62-52-42-32-22-1

1-61-51-41-31-21-1

Page 14: Clase de introducción a la estadística

17 de 44

Variación 4

2 3 4 5 6 7 8 9 10 11 12

Esta es la distribución teórica, -ver

tabla anterior-

Esta es la distribución teórica, -ver

tabla anterior-

Page 15: Clase de introducción a la estadística

18 de 44

Variación 5

2 3 4 5 6 7 8 9 10 11 12 151413

Esta es una distribución real.

Esta es una distribución real.

• Cualquier número dicho entre 2 y 12 no causará sorpresas. Son cosas “normales”.• Cualquier número dicho entre 2 y 12 no causará sorpresas. Son cosas “normales”.

Page 16: Clase de introducción a la estadística

19 de 44

Variación 6

2 3 4 5 6 7 8 9 10 11 12 151413

Esta es una distribución real.

Esta es una distribución real.

• Cualquier número fuera de ese rango, sí.Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

• Cualquier número fuera de ese rango, sí.Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

Page 17: Clase de introducción a la estadística

20 de 44

Variación 7

2 3 4 5 6 7 8 9 10 11 12

Esta es una distribución real.

Esta es una distribución real.

• Cualquier secuencia que no respete el patrón, por ejemplo un número repetido excesivamente sí. Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

• Cualquier secuencia que no respete el patrón, por ejemplo un número repetido excesivamente sí. Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

Page 18: Clase de introducción a la estadística

22 de 44

Causas Comunes de variación 1

1. Causas Comunes

Atribuibles al proceso.

Normales en condiciones operativas especificadas.

Función sólo del azar.

Muchas. Cada una genera pequeña variación.

Se eliminan o disminuyen con el rediseño del proceso, cambiando las condiciones operativas especificadas.

Es un 6 o un 8 en el juego de los dados.

Page 19: Clase de introducción a la estadística

23 de 44

Causas Comunes de variación 2

Por ejemplo, para ir de nuestra casa al trabajo durante todos los días en auto, podríamos encontrar las siguientes causas Comunes:

Los semáforos. Mayor o menor cantidad de autos en la calle.

Page 20: Clase de introducción a la estadística

24 de 44

Causas Especiales de variación 1

2. Causas Especiales

No atribuibles al proceso.

Situación que no responde al diseño o funcionamiento original del proceso.

Deben eliminarse identificando y destruyendo las causas que la generan.

Es un 14 en el juego de los dados.

Las causas Especiales no son solamente aquellas que “empeoran” el resultado. Una serie de valores con los dados de 3, 5, 4, 5, 3, 4, 5, 5, 4, 5, 3, 4... aunque ha bajado la variabilidad del resultado también es especial: no responde al Patrón.

Page 21: Clase de introducción a la estadística

25 de 44

Causas Especiales de variación 2

Por ejemplo, para ir de nuestra casa al trabajo durante todos los días en auto, podríamos encontrar las siguientes causas Especiales:

La pinchadura de una cubierta. Quedarnos sin combustible.

Page 22: Clase de introducción a la estadística

27 de 44

Causas Comunes y Especiales 2

Qué acciones tomar frente a las diferentes causas, Comunes o Especiales:

Causa Situación Acción a tomar

Comunes

El proceso está entregando lo mejor según su diseño.

Si el resultado del proceso no es el necesario, rediseñar el proceso.

Especiales

El proceso está entregando una variación diferente al diseño dadas las causas especiales.

Eliminar las causas especiales u homologarlas en el caso que disminuyan la variabilidad.

Page 23: Clase de introducción a la estadística

DMAIC - Fase 1 Medir

Distribuciones, y cálculo de parámetros y estadísticos

Page 24: Clase de introducción a la estadística

30 de 44

Técnicas Estadísticas

Estadística Descriptiva Permite describir la información de la cual disponemos,

para entender los datos.

Estadística Inferencial Usa un conjunto de datos más pequeño, una muestra,

para sacar conclusiones o hacer inferencias de un grupo más grande, la Población.

Page 25: Clase de introducción a la estadística

31 de 44

Población

Es el grupo completo de objetos en el cual estamos interesados, al cual queremos describir o del cual queremos sacar conclusiones.

A los valores reales que representan los resultados de un proceso los llamamos Parámetros.

Page 26: Clase de introducción a la estadística

32 de 44

Muestra

Es un grupo de unidades seleccionadas de la población. Al estudiar la muestra, esperamos sacar conclusiones de la población.

Por eso, debe ser representativa de toda la población, y generalmente esto es logrado a partir de la selección aleatoria de la muestra.

A los valores reales que representan los resultados de una muestra los llamamos “Estadísticos”.

Las técnicas estadísticas nos son útiles para tomar decisiones sobre un proceso o población basado en un análisis de información contenida en una muestra de esa población.

Page 27: Clase de introducción a la estadística

33 de 44

Parámetros y Estadísticos 1

Tanto de una muestra como de la Población nos interesa:

Posición Dispersión FormaPosiciónPosición DispersiónDispersión FormaForma

Page 28: Clase de introducción a la estadística

34 de 44

Parámetros y Estadísticos 2

Nomenclatura

σ = desvío estándar de la población.

µ = media de la población

N = población total.

x = estimación de la media (muestra).

s = estimación del desvío estándar (muestra).

n = tamaño de la muestra.

Page 29: Clase de introducción a la estadística

35 de 44

Promedio = Mediana = Moda Moda Promedio

Mediana

Posición (localización) 1

Estadísticos de Posición

Promedio Promedio matemático.

Mediana Valor que deja el mismo 50 % de los datos por derecha

que por izquierda.

Moda Valor más repetido.

Page 30: Clase de introducción a la estadística

36 de 44

Posición (localización) 2

Cálculo del promedio

Población Muestra

Cálculo de la Mediana

Es el valor del dato central, cuando estamos hablando de cantidad de datos impares.

Toma el valor del promedio de los dos datos centrales, cuando la cantidad de datos es par.

n

n1 X

X∑

=N

XN1μ

∑=

Page 31: Clase de introducción a la estadística

37 de 44

Variación 1

Estadísticos de Dispersión

Rango Es un estadístico que muestra la máxima variabilidad de

un conjunto de observaciones. Rango = Mayor valor – Menor valor

Desvío estándar (σ o s) Es un estadístico que señala la dispersión de los valores

respecto al valor central (de posición).

Varianza (σ2 o s2) Es el cuadrado del desvío estándar (en realidad el desvío

estándar es la raíz cuadrada de la Varianza).

Page 32: Clase de introducción a la estadística

38 de 44

Variación 2

Cálculo del desvío estándar

Población

Muestra

N

2μ)N

(X...2μ)2

(X2μ)1

(Xσ

−−+−=

1-n

2)Xn

(X...2)X2

(X2)X1

(Xs

−−+−=

Page 33: Clase de introducción a la estadística

39 de 44

Cálculo de promedio y desvío estándar 1

1°1°

2°2°

3°3°

Ejercicios Medir.Columna 7Ejercicios Medir.Columna 7Cálculos de

estadísticos y graficación

Cálculos de estadísticos y graficación

Nivel de Confianza defaultNivel de Confianza default

Page 34: Clase de introducción a la estadística

40 de 44

Cálculo de promedio y desvío estándar 2

103,5102,0100,599,097,596,0

Median

Mean

100,3100,2100,1100,099,999,899,7

1st Quartile 98,759Median 99,9623rd Quartile 101,080Maximum 103,856

99,774 100,121

99,736 100,275

1,415 1,662

A-Squared 0,76P-Value 0,048

Mean 99,948StDev 1,528Variance 2,336Skewness 0,083005Kurtosis -0,598483N 300

Minimum 96,044

Anderson-Darling Normality Test

95% Confidence Interval for Mean

95% Confidence Interval for Median

95% Confidence Interval for StDev95% Confidence I nt erv als

Summary for Tiempos de reparación4°4°

5°5°

Histograma de los datosHistograma de los datos

Muestra los Intervalos de Confianza para Mediana y MediaMuestra los Intervalos de Confianza para Mediana y Media

Valores de promedio y desvío estándar para la serie de datos

Valores de promedio y desvío estándar para la serie de datos

Resultado en un Gráfico

Resultado en un Gráfico

Page 35: Clase de introducción a la estadística

41 de 44

Cálculo de promedio y desvío estándar 3

1°1°

2°2°

4°4°

5°5°3°3°

7°7°

6°6°

Permite calcular estadísticos.Permite calcular estadísticos.

Columna con los datosColumna con los datos

Permite elegir los estadísticos a calcularPermite elegir los estadísticos a calcular

Permite elegir los gráficos a hacer

Permite elegir los gráficos a hacer

Page 36: Clase de introducción a la estadística

42 de 44

Cálculo de promedio y desvío estándar 4

Results for: EJERCICIOS MEDIR.MTW

Summary for Tiempos de reparación

Descriptive Statistics: Tiempos de reparación

Total

Variable Count N N* Mean SE Mean StDev Sum Minimum

Tiempos de repar 300 300 0 99,948 0,0882 1,528 29984,343 96,044

Variable Q1 Median Q3 Maximum Range Skewness

Tiempos de repar 98,759 99,962 101,080 103,856 7,812 0,08

Resultado en la Hoja de Sesión

Resultado en la Hoja de Sesión

8°8°

Page 37: Clase de introducción a la estadística

43 de 44

Distribución 1

Para comprender mejor a la variación del indicador, usamos una serie de distribuciones para caracterizarla.

La más conocida es la Distribución Normal (Gauss). Pero, se necesita ubicar aquella que mejor represente a los datos que se tienen.

3σ3σ

99,73%

2σ2σ

95,44%

99,999997%

6σ6σ

σ

Tiempo de viaje

Can

tidad

ed

días

3σ3σ

99,73%

2σ2σ

95,44%

99,999997%

6σ6σ

σ

Tiempo de viaje

Can

tidad

ed

días

f z ez

( ) =−1

2

2

2

π

Page 38: Clase de introducción a la estadística

44 de 44

Distribución Normal 1

Es la distribución de probabilidad que más frecuentemente se encuentra en la naturaleza.

La media, mediana y modo, todos ocurren en el centro de la distribución con ambas mitades simétricas alrededor del centro.

El área bajo la curva es igual a 1 y una vez que la media y el desvío estándar son conocidos, la curva queda definida.